搜档网
当前位置:搜档网 › 基于华为ATCA硬件平台GCU板故障引发部分呼叫异常案例分析

基于华为ATCA硬件平台GCU板故障引发部分呼叫异常案例分析

龙源期刊网 https://www.sodocs.net/doc/0311763417.html,

基于华为ATCA硬件平台GCU板故障引发部分呼叫异常案例分析

作者:王蔚

来源:《中国新通信》2013年第19期

【摘要】华为ATCA平台和原CPCI平台在业务能力的提供上保持一致,但ATCA平台采用集成度高的UPB(通用业务处理)单板,软件性能发挥硬件多核多CPU的优势,引入“GCU业务进程组”的概念。因此在硬件故障处理上与CPCI平台略有不同。本案例主要讲述ATCA平台下业务单板故障的处理过程,供大家参考。

【关键词】ATCU硬件平台GCUBSGCCU

一、故障背景

6月20日邯郸测试新局HDGS11上报0框1槽GCU单板故障,同时有M3UA链路故障告警。经过多次拨打测试发现被叫有时不能正常接通。由于上面配置有CCU/CDB/VDB/BSG进程模块,除了BSG模块是负荷分担外,其它都是主备用的,当时在1槽是主用的模块已经倒换到了0槽。但由于BSG上配置有M3UA链路,导致该BSG上的M3UA链路故障。

二、问题、事件描述

0框1槽GCU单板配置有CCU/CDB/VDB/BSG进程模块,除了BSG模块是负荷分担外,其它进程模块都是主备用的。在1槽GCU单板故障时,在1槽是主用的模块均倒换到了0

槽。但由于BSG模块是负荷分担,1槽模块上配置有M3UA链路,所以导致该BSG上的

M3UA链路故障。

三、分析与对策

1.单板故障原因分析从单板故障日志可以看到“VRD Power:Power supply failure.”的打印,即0框1槽单板VRD电源硬件故障失效且不稳定,引起单板内的VRD电源模块供电不足,单板异常下电;单板VRD供电不稳定导致单板反复重启,一直无法进入操作系统,频繁引起单板异常下电告警。

2.0槽的WCCU模块记录的到1401、1403BSG模块链路状态正常(这两个BSG在1槽单板,实际已经故障),造成三种拨测失败现象:现象一:取漫游号码时没有位置区,被叫失败。没有位置区时,POOL局点默认不会下发全网寻呼,因此也不分配漫游号码。没有位置区的原因,也是由于1300,1301VDB的用户位置更新失败(同样是位置更新的时候,这些WCCU将消息发到了故障BSG),删除了用户数据,做被叫时触发了被叫恢复,但POOL局

相关主题