1告警系統(tǒng)分析
C&C08程控交換機(jī)在運(yùn)行過程中,當(dāng)某些部件出現(xiàn)故障時(shí),交換機(jī)的告警系統(tǒng)就會(huì)檢測收集到各種軟、硬件故障,然后經(jīng)維護(hù)軟件處理后在告警臺(tái)輸出告警信息報(bào)告,并通過告警箱顯示告警級(jí)別及告警原因,發(fā)出可視、可聞信號(hào),提示維護(hù)人員進(jìn)行必要的處理,以保證設(shè)備的正常運(yùn)行。
C&C08交換機(jī)的告警系統(tǒng)采用分散采集、集中處理的方式,將各種告警信息集中到告警通信板分類處理后,再分別送到告警燈、告警箱和遠(yuǎn)端網(wǎng)管中心。根據(jù)故障對(duì)設(shè)備的影響程度、重要性及緊迫性分為緊急故障、重要故障、一般故障和提示性故障等4個(gè)告警級(jí)別。
1.1緊急告警(一級(jí)告警)
緊急告警需要緊急處理,這種告警往往具有全局性,會(huì)導(dǎo)致主機(jī)癱瘓,對(duì)應(yīng)紅色告警級(jí)別指示燈和急促鈴聲。如主機(jī)板故障、網(wǎng)板故障、時(shí)鐘板故障等,故障內(nèi)容涉及CPU、EMA、BNET、CNT、CTN、SNT、FBI等重要部件。
1.2重要告警(二級(jí)告警)
重要告警指局部范圍內(nèi)的單板或線路故障告警和事故告警,需要及時(shí)處理,否則會(huì)影響重要功能的實(shí)現(xiàn),如用戶板故障、數(shù)字中繼板故障等;對(duì)應(yīng)信號(hào)為紅色指示燈及次急促鈴聲。故障內(nèi)容涉及SIG、MFC、DRV、ST、ASL、MC2、OPT及NOD等板件,以及信令鏈路故障等。
1.3一般告警(三級(jí)告警)
一般告警,指一般性的,描述各單板或線路工作是否工作的狀態(tài)故障告警和事故告警;提醒維護(hù)人員及時(shí)查找告警原因,消除故障隱患,對(duì)應(yīng)信號(hào)為黃色指示燈及斷續(xù)鈴聲。故障內(nèi)容涉及單板復(fù)位、PCM告警等。
1.4警告告警(四級(jí)告警)
警告告警是提示性告警,指不會(huì)影響系統(tǒng)性能的提示性的故障告警和事故告警,如測試板告警,這種告警不會(huì)影響系統(tǒng)性能,不必及時(shí)處理,但對(duì)交換機(jī)運(yùn)行狀態(tài)要做到心中有數(shù),對(duì)應(yīng)信號(hào)為綠色指示燈及單次鈴聲。
在日常維護(hù)中,機(jī)房維護(hù)人員應(yīng)從以下5個(gè)方面察看告警信息:一是機(jī)架行列告警燈,二是告警箱,三是維護(hù)終端的告警臺(tái),四是單板指示燈,五是維護(hù)臺(tái)的“設(shè)備控制”單板狀態(tài)。另外有些故障可能在上述5處都無法查覺,而是來自用戶的申告。通過以上方面察看可以獲得告警信息和用戶申告信息。
2故障分析和處理的原則
C&C08的操作系統(tǒng)不僅具有各種軟件管理協(xié)調(diào)功能,同時(shí)還具有差錯(cuò)分析和處理能力。對(duì)于機(jī)房維護(hù)人員來說,后者更具有重要現(xiàn)實(shí)意義。因?yàn)樵趯?shí)際操作中,我們可以利用交換機(jī)的差錯(cuò)分析處理軟件對(duì)故障進(jìn)行分析和判斷。
當(dāng)C&C08的操作系統(tǒng)發(fā)出告警信息后,機(jī)房維護(hù)人員首先應(yīng)根據(jù)告警的級(jí)別判斷障礙性質(zhì)、重要性及地點(diǎn),并遵循以下原則對(duì)故障進(jìn)行分析和處理:
(1) 處理重要事件時(shí),首先要提取話單,以免話單丟失;
(2) 在能夠處理的范圍內(nèi),盡量不影響全局通話;
(3) 避免在話務(wù)量高峰時(shí)處理,最好在話務(wù)空閑時(shí)進(jìn)行故障處理;
(4) 觀察單板指示燈和維護(hù)終端的狀態(tài),分析相關(guān)單板;
(5) 不要盲目更換單板,防止故障擴(kuò)散;
(6) 插拔單板時(shí),一定要帶防靜電腕套,并將接地端靠地連接。
3交換機(jī)的故障定位與處理方法
3.1C&C08交換機(jī)的測試診斷功能
C&C08具有較強(qiáng)的測試診斷功能。一方面,各智能單板都具有自檢功能,設(shè)備運(yùn)行過程中,各智能單板可實(shí)時(shí)進(jìn)行自檢,一旦發(fā)生故障將自動(dòng)報(bào)警或倒換;另一方面可通過測試子系統(tǒng)向主機(jī)發(fā)送命令,對(duì)指定設(shè)備進(jìn)行測試。
3.1.1測試系統(tǒng)的組成和基本原理
(1) 測試系統(tǒng)的組成。C&C08機(jī)的測試系統(tǒng)由硬件測試設(shè)備、主機(jī)軟件和終端軟件組成。硬件測試設(shè)備主要包括用戶電路測試板(TSS)、用戶模塊母板測試總線以及帶有自測功能的各種智能單板。測試系統(tǒng)的主機(jī)軟件是指運(yùn)行于交換模塊MPU板的主機(jī)軟件中的TEST程序模塊。測試系統(tǒng)的終端軟件由BAM上的測試服務(wù)器和工作站上的測試臺(tái)組成。
(2) 測試系統(tǒng)的基本原理。測試子系統(tǒng)通過終端系統(tǒng)向主機(jī)發(fā)送人機(jī)命令,由主機(jī)下達(dá)相應(yīng)的測試命令給相應(yīng)的設(shè)備,啟動(dòng)相應(yīng)的測試任務(wù)。測試完成后將測試結(jié)果通過主機(jī)送回終端,由終端系統(tǒng)進(jìn)行分析、統(tǒng)計(jì)、顯示與打印。
3.1.2測試系統(tǒng)的主要內(nèi)容
C&C08測試系統(tǒng)的主要內(nèi)容包括3個(gè)部分,即用戶電路測試、系統(tǒng)單板測試、測試系統(tǒng)自檢。
(1) 用戶電路測試。電路測試主要指對(duì)交換機(jī)用戶電路的各項(xiàng)性能或指標(biāo)的測試。主要包括用戶內(nèi)線測試、用戶外線測試及用戶儀表測試。測試的性能指標(biāo)包括:線路絕緣電阻、絕緣電壓、絕緣電容及用戶板性能測試。
(2) 系統(tǒng)單板測試。系統(tǒng)單板測試是指系統(tǒng)對(duì)23種單板提供的單板自檢功能,如MPU、EMA、BNET板等。各智能單板在平時(shí)即可進(jìn)行實(shí)時(shí)自檢,一旦有故障將自動(dòng)向終端發(fā)送告警信息。當(dāng)測試系統(tǒng)向上列單板發(fā)出測試命令后,根據(jù)各單板返回的測試結(jié)果可判斷出各單板的運(yùn)行狀態(tài),從面進(jìn)行故障定位。
(3) 測試系統(tǒng)自檢。測試系統(tǒng)自檢主要是對(duì)測試板、測試總線的檢測,以防止因測試板或測試總線的原因?qū)е聹y試結(jié)果出現(xiàn)錯(cuò)誤。
在日常的維護(hù)工作中,維護(hù)人員經(jīng)常需要利用交換系統(tǒng)提供的各種測試手段對(duì)設(shè)備出現(xiàn)的各類故障進(jìn)行定位及定性分析,所以掌握交換機(jī)的各種測試內(nèi)容尤為重要。
3.2C&C08交換機(jī)故障分析和處理的方法
故障不同,故障的表現(xiàn)形式也不盡相同。機(jī)房維護(hù)人員要根據(jù)不同故障的表現(xiàn)形式,結(jié)合實(shí)際工作經(jīng)驗(yàn),判斷故障的級(jí)別,分析故障現(xiàn)象,找出故障產(chǎn)生的原因,并準(zhǔn)確鎖定故障位置,迅速排除故障。C&C08交換機(jī)故障處理方法一般有以下5種:
(1) 排除法。某些故障由于涉及的故障點(diǎn)較多,應(yīng)先羅列出故障現(xiàn)象及故障發(fā)生的可能性,根據(jù)話音和信令的流程進(jìn)行分析,逐步排除。分析故障可能性時(shí),要盡可能做到全面、客觀,不要有遺漏,實(shí)際排除可能性時(shí),應(yīng)從可能性低的開始排除,層層遞進(jìn)。
(2) 對(duì)比法。參照本系統(tǒng)正常運(yùn)行的設(shè)備或其他工作場地正常運(yùn)行的設(shè)備數(shù)據(jù)作基準(zhǔn),仔細(xì)對(duì)比故障設(shè)備和正常設(shè)備之間的參數(shù)區(qū)別,分析故障發(fā)生的可能性,找出故障的準(zhǔn)確位置。
(3) 替換法。對(duì)硬件設(shè)備故障的處理往往采用替換法。即當(dāng)懷疑某個(gè)電路板出現(xiàn)問題時(shí),維護(hù)人員可通過替換電路板的方法進(jìn)行判斷和驗(yàn)證。替換時(shí)應(yīng)做到替換的正常設(shè)備要與被替換的設(shè)備完全相符,替換后進(jìn)行相關(guān)的后續(xù)處理及恢復(fù)性的操作,如果一切恢復(fù)正常,則表示此故障為硬件設(shè)備發(fā)生問題。
(4) 數(shù)據(jù)修改、數(shù)據(jù)再設(shè)定法。此方法適用于軟件方面的故障鑒定。如果系統(tǒng)軟件在設(shè)計(jì)和編制時(shí)存在某種缺陷,或是系統(tǒng)參數(shù)、數(shù)據(jù)及用戶數(shù)據(jù)等出現(xiàn)某種錯(cuò)誤,會(huì)導(dǎo)致系統(tǒng)不能在特定情況下正常執(zhí)行某些任務(wù)。當(dāng)此類現(xiàn)象發(fā)生時(shí),維護(hù)人員可采用數(shù)據(jù)修改或數(shù)據(jù)再設(shè)定的方法進(jìn)行處理。
(5) 人工啟動(dòng)和邏輯復(fù)位法。即重新啟動(dòng)或復(fù)位法,一般采取按復(fù)位鍵,重新插拔單板,或者直接關(guān)閉電源重新復(fù)位,對(duì)單板的硬件、軟件進(jìn)行邏輯初始化,使其恢復(fù)正常的工作狀態(tài)。此種方法一般是在單板硬件或軟件發(fā)生混亂而無法正中國論文聯(lián)盟www.Lwlm.com常工作的時(shí)候采用。