日本最新免费二区,欧美熟妇另类久久久久久多毛,亚洲成色A片77777在线小说,国产69精品久久久久999小说

漢信
 
 
 
全國(guó)免費(fèi)銷(xiāo)售熱線:800-830-1026
致力打造光通信設(shè)備十大品牌
 
  7*24小時(shí)免費(fèi)
銷(xiāo)售服務(wù)熱線
    800-830-1026


 
   
 

通信基礎(chǔ)知識(shí)當(dāng)前位置 > 首頁(yè) > 通信基礎(chǔ)知識(shí) > 瀏覽內(nèi)容

利用ICMP實(shí)現(xiàn)網(wǎng)絡(luò)狀態(tài)監(jiān)測(cè)系統(tǒng)
2009/4/16

    摘要 本文提出并描述了一種利用ICMP協(xié)議對(duì)網(wǎng)絡(luò)傳輸層進(jìn)行實(shí)時(shí)監(jiān)控的方法。它的應(yīng)用能幫助用戶(hù)了解網(wǎng)絡(luò)運(yùn)行狀態(tài)并及時(shí)發(fā)現(xiàn)傳輸層出現(xiàn)的故障。文中對(duì)這種監(jiān)控系統(tǒng)從設(shè)計(jì)到驗(yàn)證、實(shí)現(xiàn)進(jìn)行了詳細(xì)闡述。目前該系統(tǒng)已經(jīng)實(shí)現(xiàn),并在工程應(yīng)用中取得了良好的效果。

    一、概述

    在電信級(jí)設(shè)備功能日益完善,組網(wǎng)日趨復(fù)雜的今天,對(duì)設(shè)備的管理監(jiān)控已經(jīng)成為保障設(shè)備穩(wěn)定、正常運(yùn)轉(zhuǎn)的必要手段。其中,對(duì)底層通信網(wǎng)絡(luò)的監(jiān)控是整個(gè)監(jiān)控管理系統(tǒng)的核心和基礎(chǔ)。

    以前眾多企業(yè)級(jí)的通信核心網(wǎng)設(shè)備因?yàn)闆](méi)有完善的監(jiān)控管理,缺乏告警及系統(tǒng)運(yùn)行狀態(tài)的相關(guān)日志信息,致使維護(hù)人員無(wú)法準(zhǔn)確掌握設(shè)備運(yùn)行狀態(tài),設(shè)備運(yùn)轉(zhuǎn)達(dá)不到用戶(hù)所必須的穩(wěn)定性及安全性要求。尤其當(dāng)網(wǎng)絡(luò)物理硬件出現(xiàn)故障造成網(wǎng)絡(luò)中斷時(shí),如果不能及時(shí)發(fā)現(xiàn)并定位,不僅會(huì)造成用戶(hù)長(zhǎng)時(shí)間通信中斷,而且會(huì)讓我們廠商的研發(fā)和工程人員無(wú)謂浪費(fèi)時(shí)間去逐步查找軟件問(wèn)題。針對(duì)這種現(xiàn)象,我們提出一種網(wǎng)絡(luò)狀態(tài)監(jiān)測(cè)的解決方案。

    這種監(jiān)測(cè)方法主要是基于ICMP協(xié)議開(kāi)發(fā)的,基本原理類(lèi)似Windows自帶的Ping功能。Ping的目的是為了測(cè)試網(wǎng)絡(luò)中的另一臺(tái)主機(jī)是否可達(dá)。該程序給主機(jī)發(fā)送一份ICMP回顯請(qǐng)求報(bào)文,并等待返回ICMP回顯應(yīng)答。通常Ping是對(duì)兩個(gè)TCP/IP系統(tǒng)連通性進(jìn)行測(cè)試的基本工具。它只利用ICMP回顯請(qǐng)求和回顯應(yīng)答報(bào)文,無(wú)須經(jīng)過(guò)傳輸層(TCP/UDP),從而將問(wèn)題定位到IP層以下,避免了傳輸層和應(yīng)用層的問(wèn)題干擾。Ping服務(wù)一般在內(nèi)核中實(shí)現(xiàn)ICMP的功能。

    由于Ping具有上述特點(diǎn),其統(tǒng)計(jì)結(jié)果信息可以被利用顯示底層傳輸網(wǎng)絡(luò)的狀態(tài)。關(guān)鍵的統(tǒng)計(jì)數(shù)據(jù)有:

    ●報(bào)文抵達(dá)序列,由ICMP序列號(hào)(ICMP-seq)顯示;

    ●每個(gè)報(bào)文往返所用時(shí)間,單位為ms(毫秒);

    ●報(bào)文丟失百分比,它在ping命令輸出的總結(jié)行顯示。

    其中,序列號(hào)用于標(biāo)識(shí)每一個(gè)響應(yīng)包的先后順序,用于檢驗(yàn)網(wǎng)絡(luò)傳輸是否會(huì)重復(fù)或失序;往返時(shí)間RTT可以顯示出網(wǎng)絡(luò)傳輸狀態(tài)的好壞;而報(bào)文丟失百分比則是對(duì)網(wǎng)絡(luò)傳輸質(zhì)量的統(tǒng)計(jì)評(píng)估。

    基于上述特性,我們提出一種多方向網(wǎng)絡(luò)狀態(tài)監(jiān)測(cè)的方法,并簡(jiǎn)要說(shuō)明其實(shí)現(xiàn)原理。

    二、網(wǎng)絡(luò)狀態(tài)監(jiān)測(cè)實(shí)現(xiàn)原理

    TCP/IP三層網(wǎng)絡(luò)作為應(yīng)用層傳輸數(shù)據(jù)的基礎(chǔ),尤其是電信級(jí)交換數(shù)據(jù)的傳輸基礎(chǔ),無(wú)論從安全性還是可靠性上都有非常高的要求,因此,網(wǎng)絡(luò)狀態(tài)監(jiān)控已經(jīng)成為目前眾多設(shè)備提供商的研究重點(diǎn)之一。

    如果僅僅使用Windows或者Linux系統(tǒng)自帶的Ping功能作為狀態(tài)監(jiān)控手段,我們只能實(shí)現(xiàn)單一的一臺(tái)服務(wù)器到另一臺(tái)服務(wù)器的通信監(jiān)測(cè)。如果該服務(wù)器與多個(gè)其它服務(wù)器同時(shí)建立TCP/IP連接,就必須通過(guò)多次重復(fù)使用ping命令才能達(dá)到同時(shí)監(jiān)控每條鏈路方向的目的。對(duì)于復(fù)雜的電信核心網(wǎng)來(lái)說(shuō),單一的點(diǎn)對(duì)點(diǎn)監(jiān)控已經(jīng)無(wú)法滿(mǎn)足其發(fā)展需求,我們必須找出一種單臺(tái)服務(wù)器可同時(shí)監(jiān)控多臺(tái)(幾十甚至幾百臺(tái))服務(wù)器的跨平臺(tái)網(wǎng)絡(luò)狀態(tài)監(jiān)測(cè)方法,以滿(mǎn)足集中監(jiān)控整個(gè)核心網(wǎng)絡(luò)的目的。

    基于上述原因,利用ping的原理開(kāi)發(fā)出一種用于多點(diǎn)通信狀態(tài)監(jiān)測(cè)的系統(tǒng),具體實(shí)現(xiàn)機(jī)制如下:

    監(jiān)控系統(tǒng)模塊通過(guò)指定接口函數(shù)接收待監(jiān)測(cè)的客戶(hù)端服務(wù)器IP地址,將該客戶(hù)端的地址記錄到內(nèi)部統(tǒng)計(jì)結(jié)構(gòu)列表中,并在記錄時(shí)判定該地址與已保存地址的重復(fù)性(重復(fù)的地址將不會(huì)被二次記錄),然后,通過(guò)定時(shí)器周期向所有客戶(hù)端地址方向發(fā)送ICMP探測(cè)包,對(duì)其鏈路狀態(tài)進(jìn)行監(jiān)控。監(jiān)控系統(tǒng)的基本流程如圖1所示。

利用ICMP實(shí)現(xiàn)網(wǎng)絡(luò)狀態(tài)監(jiān)測(cè)系統(tǒng)

圖1 監(jiān)控系統(tǒng)的基本流程

    監(jiān)測(cè)過(guò)程中,分別對(duì)每一被控鏈路方向的收發(fā)ICMP探測(cè)消息進(jìn)行統(tǒng)計(jì):當(dāng)收到響應(yīng)的時(shí)延小于用戶(hù)指定閥值的時(shí)候,記錄該消息的接收時(shí)間、序列號(hào),以及接收ICMP響應(yīng)的RTT往返時(shí)間,否則做丟包處理。通常情況下,由于電信級(jí)設(shè)備的高要求性,我們認(rèn)為響應(yīng)時(shí)間大于1s的網(wǎng)絡(luò)是不可用網(wǎng)絡(luò),屬于嚴(yán)重堵塞或中斷狀態(tài),必須告警并盡快查明恢復(fù)。正常通信時(shí),網(wǎng)內(nèi)響應(yīng)時(shí)間應(yīng)小于10ms,網(wǎng)間小于100ms才是具有高可靠性的傳輸網(wǎng)絡(luò)。發(fā)送ICMP探測(cè)包的周期應(yīng)該由用戶(hù)根據(jù)安全需要自行設(shè)定。

    每發(fā)送10包ICMP探測(cè)消息后,應(yīng)該對(duì)各被控方向的整體網(wǎng)絡(luò)狀況進(jìn)行一次統(tǒng)計(jì),內(nèi)容包括收到響應(yīng)的數(shù)量、時(shí)延及丟包率等。將所有的統(tǒng)計(jì)數(shù)據(jù)全部記錄在指定目錄下的log日志文件中,日志文件的大小在大于一個(gè)閥值時(shí)應(yīng)該保存為備份文件,然后重新記錄。通過(guò)日志在本機(jī)中查看服務(wù)器在一個(gè)周期時(shí)間(例如一周)內(nèi)的網(wǎng)絡(luò)通信狀況,便于維護(hù)人員及時(shí)發(fā)現(xiàn)并提前避免傳輸層的問(wèn)題。

    這里需要設(shè)置一個(gè)周期上報(bào)線程,每隔一個(gè)用戶(hù)指定的時(shí)間周期,通過(guò)計(jì)算,將網(wǎng)絡(luò)狀態(tài)統(tǒng)計(jì)數(shù)據(jù)主動(dòng)上報(bào)到操作維護(hù)臺(tái)。上報(bào)內(nèi)容包括被監(jiān)控端的IP地址,RTT往返時(shí)間和丟包率等。此外,該線程還對(duì)每個(gè)被監(jiān)測(cè)客戶(hù)端的收發(fā)消息進(jìn)行差值統(tǒng)計(jì),一旦發(fā)現(xiàn)丟包立即通過(guò)接口函數(shù)上報(bào)告警至維護(hù)臺(tái)。告警內(nèi)容包含監(jiān)控客戶(hù)端的IP地址和告警級(jí)別。

    需要注意的是,由于采用多方向連續(xù)ICMP監(jiān),所以,對(duì)于ICMP響應(yīng)消息一定要進(jìn)行合理的區(qū)分,以避免各個(gè)監(jiān)控方向的統(tǒng)計(jì)混亂。由于傳輸網(wǎng)絡(luò)具有不確定性,并不能保證每一包到達(dá)的先后順序,此時(shí)通過(guò)IP地址、序列號(hào)和消息pid號(hào)區(qū)分響應(yīng)消息就顯得尤為重要。另外,為了使用發(fā)送接收超時(shí)設(shè)置,必須設(shè)定socket為SO_RCVTIMEO和SO_SNDTIMEO方式,否則一旦某一監(jiān)測(cè)方向出現(xiàn)網(wǎng)絡(luò)超時(shí)中斷問(wèn)題,程序?qū)⒚媾R被懸掛死鎖的危險(xiǎn)。

    當(dāng)返回ICMP回顯應(yīng)答時(shí),要保存消息序列號(hào)和TTL生存時(shí)間,并計(jì)算探測(cè)消息往返時(shí)間。ICMP消息序列號(hào)計(jì)數(shù)從0開(kāi)始,每發(fā)送一次新的回顯請(qǐng)求,序列號(hào)加1。程序記錄返回的每個(gè)分組的消息序列號(hào),供查看是否有分組丟失、失序或重復(fù),并通過(guò)在ICMP報(bào)文數(shù)據(jù)中存放發(fā)送請(qǐng)求的時(shí)間值來(lái)計(jì)算往返時(shí)間。當(dāng)應(yīng)答返回時(shí),用當(dāng)前時(shí)間減去存放在ICMP報(bào)文中的消息發(fā)起時(shí)間,即往返時(shí)間。

    基于ICMP的網(wǎng)絡(luò)監(jiān)測(cè)方法,優(yōu)點(diǎn)是具有平臺(tái)無(wú)關(guān)性。無(wú)論服務(wù)器、普通計(jì)算機(jī)或者電信交換機(jī),只要是支持TCP/IP協(xié)議的操作系統(tǒng),都可以被列為監(jiān)控對(duì)象。即此監(jiān)控方式不受被控端所使用的操作系統(tǒng)和操作平臺(tái)限制。這樣不僅提供了極強(qiáng)的平臺(tái)通用性,還大大減少了開(kāi)發(fā)和維護(hù)所需成本。

    三、試驗(yàn)數(shù)據(jù)分析

    選擇在一個(gè)相對(duì)穩(wěn)定的局域網(wǎng)(192.168.1.網(wǎng)段)內(nèi)搭建實(shí)驗(yàn)環(huán)境,這樣可以在測(cè)定監(jiān)控系統(tǒng)運(yùn)行穩(wěn)定性的同時(shí),通過(guò)斷開(kāi)、連接網(wǎng)線的操作,實(shí)時(shí)模擬測(cè)試各種異常情況的發(fā)生。這里只給出基本的測(cè)試數(shù)據(jù)。

    簡(jiǎn)單環(huán)境構(gòu)造圖示于圖2。

利用ICMP實(shí)現(xiàn)網(wǎng)絡(luò)狀態(tài)監(jiān)測(cè)系統(tǒng)

圖2 實(shí)時(shí)模擬測(cè)試環(huán)境

    其中,以1.171作為監(jiān)控的服務(wù)器,160、208、211三臺(tái)主機(jī)作為被監(jiān)控的客戶(hù)端。當(dāng)服務(wù)器分別收到三個(gè)被控端的IP地址,就會(huì)以60秒為周期分別對(duì)三臺(tái)服務(wù)器進(jìn)行實(shí)時(shí)監(jiān)控;每間隔10分鐘做一次統(tǒng)計(jì)寫(xiě)日志操作(該時(shí)間周期用戶(hù)可調(diào))。

    正常情況下,日志會(huì)每隔10分鐘記錄一次收發(fā)總包數(shù)和丟包率。為了測(cè)試超時(shí)中斷情況,拔掉192.168.1.160的網(wǎng)線模擬網(wǎng)絡(luò)中斷,再查看日志。

    此時(shí),日志文件會(huì)記錄下每次響應(yīng)超時(shí)的狀況,并在該次探測(cè)失敗時(shí)上報(bào)告警消息至維護(hù)臺(tái),然后,統(tǒng)計(jì)數(shù)據(jù)時(shí)算出當(dāng)前1.160服務(wù)器的丟包率。監(jiān)控系統(tǒng)運(yùn)行時(shí),其它方向的統(tǒng)計(jì)信息并未因該方向丟包而受到影響,各個(gè)客戶(hù)端的統(tǒng)計(jì)信息是相互獨(dú)立的。另外,也應(yīng)該對(duì)網(wǎng)內(nèi)響應(yīng)時(shí)間超過(guò)100ms的數(shù)據(jù)包記錄統(tǒng)計(jì)(100ms指代網(wǎng)絡(luò)延時(shí)過(guò)長(zhǎng)的閥值),以供查看整個(gè)網(wǎng)絡(luò)是否處于超負(fù)荷工作狀態(tài)。

    在記錄當(dāng)前時(shí)間、IP地址和序列號(hào)的同時(shí),具體響應(yīng)時(shí)間也被詳細(xì)列出,以供維護(hù)人員定位故障時(shí)間和故障的嚴(yán)重程度。

    該監(jiān)控系統(tǒng)已經(jīng)在Windows、Linux、Unix、Vxworks等系統(tǒng)平臺(tái)上進(jìn)行過(guò)穩(wěn)定性測(cè)試,可正常使用。筆者針對(duì)測(cè)試過(guò)程中遇到的一些問(wèn)題做如下總結(jié),以供參考。

    在發(fā)送端上,往返時(shí)間的計(jì)算結(jié)果有時(shí)可能為0 ms。這是因?yàn)槌绦蛩诘哪承┓⻊?wù)器CPU時(shí)間精度最低只能到10ms級(jí),低于10ms的時(shí)間精度無(wú)法取得,只能以數(shù)字0代替。

    測(cè)試發(fā)現(xiàn),通常第1個(gè)響應(yīng)消息的往返時(shí)間值要比其他的大。這是由于目的端的硬件地址不在ARP高速緩存中的緣故。在發(fā)送第一個(gè)回顯請(qǐng)求之前要發(fā)送一個(gè)ARP請(qǐng)求并接收ARP應(yīng)答,這需要花費(fèi)幾毫秒甚至幾十毫秒的時(shí)間。

    在網(wǎng)絡(luò)運(yùn)行中,正常工作狀態(tài)是:響應(yīng)時(shí)間趨近于0,報(bào)文丟失很少或沒(méi)有,并且報(bào)文按序抵達(dá)。如果報(bào)文丟失較多而響應(yīng)時(shí)間低或報(bào)文亂序抵達(dá),說(shuō)明網(wǎng)絡(luò)硬件可能出錯(cuò)。在以太網(wǎng)中,可能是線纜終端故障,線纜分段故障或中繼器故障。首先檢查線纜終端,它很容易出故障,尤其是終端器放在用戶(hù)可碰到的工作區(qū)中;然后看中繼器的工作狀態(tài),長(zhǎng)時(shí)間使用的中繼器出問(wèn)題的幾率也比較高。

    如果在廣域網(wǎng)上進(jìn)行測(cè)試,則上述報(bào)文丟失較多而響應(yīng)時(shí)間低的現(xiàn)象可能屬于正常范圍。由于TCP/IP適用于不可靠網(wǎng)絡(luò),某些廣域網(wǎng)的報(bào)文丟失率可能較高。但是若對(duì)于安全級(jí)別要求較高的電信級(jí)網(wǎng)絡(luò)而言,上述現(xiàn)象一定表明出現(xiàn)網(wǎng)絡(luò)故障,需要馬上進(jìn)行問(wèn)題排查。

    四、應(yīng)用情況及其缺陷

    現(xiàn)階段,該監(jiān)控方法已經(jīng)應(yīng)用于大唐電信SCDMA多組組網(wǎng)中,為核心交換網(wǎng)絡(luò)的底層傳輸系統(tǒng)提供監(jiān)控,在工程應(yīng)用中獲得了良好的效果。在給已開(kāi)發(fā)的網(wǎng)絡(luò)管理系統(tǒng)項(xiàng)目中也使用了該監(jiān)控方法,對(duì)整個(gè)網(wǎng)絡(luò)的底層通信狀態(tài)進(jìn)行監(jiān)控。應(yīng)用前景及可擴(kuò)展性都較好。

    但是,該方法也存在一定的弊端。如果不能Ping到某臺(tái)主機(jī),那么,就不能Telnet或FTP到那臺(tái)主機(jī),即網(wǎng)絡(luò)可能存在問(wèn)題。隨著Internet安全意識(shí)的增強(qiáng),出現(xiàn)了提供訪問(wèn)控制清單的路由器和防火墻。一臺(tái)主機(jī)的可達(dá)性可能不只取決于IP層是否可達(dá),還取決于使用何種協(xié)議及端口號(hào)。監(jiān)測(cè)程序的運(yùn)行結(jié)果可能顯示某臺(tái)主機(jī)不可達(dá),但可以用Telnet遠(yuǎn)程登錄到該臺(tái)主機(jī)的25號(hào)端口(郵件服務(wù)器)。即此方法不適用于有防火墻和限制IP功能的網(wǎng)絡(luò)。要使用該模塊,必須關(guān)閉服務(wù)器上相應(yīng)的防火墻功能。

    五、結(jié)束語(yǔ)

    網(wǎng)絡(luò)傳輸層是整個(gè)現(xiàn)在通信系統(tǒng)的基礎(chǔ)和核心,其好壞直接影響到上層應(yīng)用程序?qū)崿F(xiàn)的質(zhì)量。利用ICMP協(xié)議開(kāi)發(fā)的這種監(jiān)測(cè)方法提供了對(duì)底層傳輸物理設(shè)備(包括網(wǎng)卡、hub、路由器或者網(wǎng)線等物理設(shè)備)的實(shí)時(shí)監(jiān)測(cè)。并能滿(mǎn)足多服務(wù)器跨平臺(tái)的復(fù)雜組網(wǎng)監(jiān)控需求。

    通過(guò)使用該監(jiān)測(cè)系統(tǒng),在網(wǎng)絡(luò)出現(xiàn)問(wèn)題時(shí),能迅速定位故障,以檢修或更換相應(yīng)的硬件設(shè)備,并通過(guò)配合其他診斷方法的使用查找詳細(xì)故障原因,從而大大減少了網(wǎng)絡(luò)故障排查時(shí)間,為設(shè)備維護(hù)減少了人力和物力的投入。

    今后,可以通過(guò)給該系統(tǒng)擴(kuò)展類(lèi)似Windows系統(tǒng)下的tracert功能,使該監(jiān)控系統(tǒng)應(yīng)用于不同網(wǎng)段的高等級(jí)分級(jí)監(jiān)測(cè),這樣將有助于更詳細(xì)地監(jiān)控整個(gè)商業(yè)運(yùn)行網(wǎng)絡(luò)的狀態(tài),精確定位網(wǎng)絡(luò)故障。這種擴(kuò)展有待于研究和開(kāi)發(fā)。

 

產(chǎn)品導(dǎo)航:光端機(jī) 電話光端機(jī) PCM設(shè)備 光纖收發(fā)器 光電轉(zhuǎn)換器 協(xié)議轉(zhuǎn)換器 漢信光纜 光Modem(光貓) 視頻光端機(jī) 數(shù)字光端機(jī)
 

版權(quán)所有:漢信(廣東)通信設(shè)備股份有限公司
地   址:廣州市科學(xué)城光譜西路3號(hào)中國(guó)普天研發(fā)樓810(地理位置
電   話:020-85548287 020 85548285 傳 真:020-82189311
E-MAIL:sales@hansun.com.cn  Http://k00rv.cn
ICP證號(hào)碼:粵ICP備08032431號(hào)