SDH技术

华为OSN3500上报BUS_ERR和HSC_UNAVAIL告警

问题描述

华为OSN3500设备的10板位UXCSB板上报BUS_ERR和HSC_UNAVAIL告警,该OSN3500还带了一个扩展子架,主机版本为5.21.12.42。

处理过程

华为OSN3500上报BUS_ERR告警,有两种可能,其一是误报,其二就是真实存在。经过确认,用户的主机版本和网管版本都没有误报BUS_ERR的可能。因此,上报的BUS_ERR和HSC_UNAVAIL应该是真实的。另外,也排除了扩展子架连接错误导致出现BUS_ERR的情况。查看返回的告警发现BUS_ERR的参数为“0x12 0x02 0x04 0x02 0xff”,而HSC_UNAVAIL的参数为“0x04 0x01 0x0a 0xff 0xff”,仔细分析这些告警参数后得出两点结论:

(1)HSC_UNAVAIL是由BUS_ERR引起的;

(2)BUS_ERR则是由B1误码导致的;

另外这两个告警都存在自动结束后又自动产生的特点,并且业务没有受到影响。

经过进一步的分析,发现如果连接扩展子架的10号UXCSB单板的上端口的DB头电缆存在问题则将会导致B1误码,但为什么没有进行DB头切换从而消除此告警需要查看10号交叉板的寄存器数据。

经过用OPTP命令采集10号板位的寄存器数据后,发现10板位的UXCSB单板的第二根总线有B1误码,而第一根总线是好的。进一步分析用户在扩展子架上的业务,发现只有52号单板有业务,而52单板只对应电缆的第1根总线。现在检测到的是第2根总线有B1误码,但第2根总线却又没有配置业务,所以软件为了保证业务不闪断(切换DB头会有误码产生),只上报了BUS_ERR告警而没有进行DB头切换。 到此,可以确定是10号交叉板的上端口的DB头电缆坏了。

另外,还有一个问题需要解决,即为什么这两个告警会时有时无呢?这是因为10号交叉单板目前是备板,我们的设备在出现时钟不同步时,将不检测总线告警。具体说来,当时钟异步持续30s时,BUS_ERR等总线告警将消失,时钟同步后,又将恢复检测。备板会出现偶尔的时钟异步,所以BUS_ERR等告警将时有时无。

根因

连接扩展子架的电缆损坏

解决方案

更换10号交叉板的上端口的DB头电缆后,告警消除。

建议与总结

华为OSN3500 BUS_ERR是一个比较常见的告警,分析它的上报原因需要从它的告警参数入手,而不要简单地借助于网管上的告警原因提示。



本章相关技术资料和SDH设备故障处理流程由深圳市世樾信息技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售


销售华为OSN3500设备_产品报价_销售厂家_产品特性_产品描述_深圳世樾信息科技SDH传输设备销售有限公司
供应华为OSN3500设备_故障处理_安装调测_技术指标_技术参数_深圳世樾信息科技SDH传输设备销售有限公司

推荐信息

wechat

扫一扫关注我们

热线:15989490421 Wechat 3287806562