继保,科普,通信工程,故障处理,老通信工程师整理:PTN的7大故障处理技巧

tdavidwang 2016-10-19 20:44:04

老通信工程师整理:PTN的7大故障处理技巧

通信工程项目管理平台CEPMS

随着中兴PTN设备的到来,SDH走向了将近淘汰的道路,因为PTN设备承载的业务量和各对面功能都比SDH优秀,所以SDH势必会给PTN淘汰,作为设备维护和故障处理人员,必须熟悉设备系统,掌握PTN原理及信号流,熟悉组网结构以及日常维护的基本操作。


处理设备故障必须懂的故障处理流程(如图)、故障处理方法以及故障处理完成后的研讨。

故障处理基本原则:维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重程度、危害程度。询问相关操作人员,是否有直接原因导致此故障,比如(光缆中断、尾纤损坏等);查清楚设备的历史操作,历史告警,还有是否重复的故障,查看之前故障的处理情况等;根据现场查看的故障现象和询问的结果,结合自己的知识进行分析,进行故障定位,判断故障点和故障原因。根据之前自己的判断,采取相应的措施,例如更换单板、更换尾纤或者是跳纤等。

出现故障的原因主要有以下几个:工程问题(基站扩容或者设备割接引起),外部原因(光缆中断,市电中断),操作不当,设备对接问题(尾纤故障、接口没插好或者是不清洁),设备自身原因(单板故障,电源故障等)。

故障定位的基本原则:首先排除外部传输原因,然后到设备。先定位故障到单站,然后到单板,排除线路问题后,然后到支路。常用故障定位方法:观察分析法、测试法、替换法、配置数据分析法、更改配置法、仪表测试法、经验处理法。

观察分析法:检查设备运行指示灯,获取告警信息。通过询问网管查询告警以及设备运行状态,收集故障信息(第一时间检查网元运行的时间是否和网管计算机时间同步,如果不同步则有可能导致产生误告信息)。对关键的告警状态以及告警信息进行分析,分析故障原因。通过进行分析,定位故障到单站单板。

测试法:当组网、业务和故障信息相当复杂时,或者设备没有出现明显的告警信息上报时,可以利用网管提供的维护功能进行测试,判断故障点和故障类型,最常用的测试方法是环回,硬件环回:光口环回和电口环回,软件环回、线路侧环回和终端侧环回。

环回的基本步骤包括有:选择故障站点。从故障站点中选择一条受影响的单板。逐段进行环回,定位故障到单站,乃至单板。

替换法:替换法就是使用一个工作正常的板块或者尾纤去替换一个被怀疑工作不正常的板块或者尾纤,从而达到定位故障、排除故障的目的。这里的物件,可以是一段线缆、一块单板或一端设备,替换法常用于一下情况:排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等 ,故障定位到单站后,排除单站内单板的问题 ,解决电源、接地问题,采用替换法,一般都要求有备件。

配置数据分析法:配置数据分析法主要用于解决由于设备配置变更或维护人员的误操作导致的故障。常见的情况有:接口配置问题(VLAN、IP接口等)通道配置问题(隧道、伪线等)业务配置问题,维护操作原因(环回,告警插入等),网管和网元配置数据不一致原因,配置数据分析法一般要求维护人员具备较丰富的经验和知识。

更改配置法:更改配置法是通过更改设备配置来定位故障的方法,操作起来比较复杂,对维护人员的要求较高,因此一般用于在没有备板的情况下临时恢复业务,更改配置法常用于下面情况:出现业务滑码问题时,更改时钟源配置和时钟抽取方向进行定位,如果怀疑支路板的某些通道或某一块支路板有问题,可以将时隙配置到另外的通道或另一支路板。如果怀疑背板某个槽位有问题,可以通过更改板位配置进行排除,更改设备配置之前,应备份原有配置,同时详细记录所进行的操作,以便于故障定位和数据恢复。

仪表测试法:仪表测试法是指利用仪表定量测试设备的工作参数,一般用于排除传输设备外部问题以及与其他设备的对接问题。仪表测试法常用于以下情况:如怀疑电源供电电压过高或过低,可以用万用表进行测试,如传输设备与其他设备无法对接,怀疑设备接地不良,可以用万用表测量通道发端信号地和收端信号地之间的电压值,如传输设备与其他设备无法对接,怀疑接口信号不兼容,可以通过信号分析仪表观察帧信号是否正常,开销字节是否正常,是否有异常告警,进而判断故障原因,通过仪表测试法分析定位故障比较准确,可信度高,但是对仪表有需求,同时对维护人员的要求也比较高。

经验处理法:在一些特殊的情况下,由于瞬间供电异常、外部强烈的电磁干扰等,致使设备单板进入异常工作状态,发生业务中断、MCC通信中断等故障,此时设备的配置数据完全正常,在这种情况下通过复位等操作重新恢复业务,常用的经验处理方法有:复位单板,插拔单板,重新下发数据,掉电重启。此类方法不利于故障的彻底清除,只用于紧急情况,业务恢复并非意味着故障已消除,设备可能依然存在隐患

常见故障分类:通信故障,业务中断类故障,时钟同步类故障,风扇故障,设备对接故障。

比如说网管登录不上网元,网管登录网元的速度慢,网管登录网元忽通忽断,可能原因:接入网元和EMS之间的连接故障,错误的IP设置,光纤错连,主控单板故障,光板故障。还有就是A、B、C、D四站点组成链形网,A为接入网元,光路上无告警,但登录不上网元C和网元D,可能原因:供电故障,接地问题,交换侧、用户侧问题,光纤/电缆中断,人为误操作 (环回,插入告警等),保护倒换失败,单板故障。

一个维护人员,懂得如何灵活地采用各种方法解决不同类型的故障,在故障维护过程中,怎样尽可能地降低对其他正常运行业务的影响,把处理故障中断的业务量降到最低,观察分析法是故障定位的主要手段。如何增加故障处理经验,提高自身的故障处理能力,不段提高对此专业知道的认识和了解,这些都有利于故障的处理。

投稿作者:周威文 

北京市电信工程局有限公司广东分公司  

网优雇佣军投稿邮箱:wywd11@126.com

长按二维码关注

通信路上,一起走!

内容转载自公众号

网优雇佣军
网优雇佣军
了解更多
阅读

文章来源