MPLS提供一個完全不依賴於任何三層協議或二層協議的OAM(Operation, Administration and Maintenance,操作、管理和維護)機製,在MPLS的數據平麵實現以下功能:
l 確定LSP的連通性;
l 衡量網絡的利用率以及度量網絡的性能;
l 在鏈路出現缺陷或故障時迅速進行保護倒換,以便根據與客戶簽訂的SLA(Service Level Agreement,服務等級協定)提供相應等級的服務。
利用MPLS OAM機製,可以有效地檢測、確認並定位出源於MPLS層網絡內部的缺陷;報告缺陷並做出相應的處理;在出現故障的時候,能夠提供保護倒換的觸發機製。
MPLS OAM的報文類型包括CV(Connectivity Verification,連通性檢測)、FFD(Fast Failure Detection,快速缺陷檢測)和BDI(Backward Defect Indication,反向缺陷通告)3種。
報文的功能及格式如下:
MPLS OAM CV報文由入節點發送,通過被檢測的LSP到達出節點,以此進行LSP的連通性檢測。其格式如圖 1。
圖 1 MPLS OAM CV報文格式
圖 1中各字段含義如表 1所示。
表 1 MPLS OAM CV報文字段含義
字段 | 描述 |
Function type | 報文類型,0x01代表CV報文 |
Reserved | 保留字段,取值為全0 |
LSP trail termination source identifier | TTSI,源宿連接標識,網絡中一條LSP唯一的標識。由16字節的Ingress LSR ID與4字節的LSP ID組成。對於IPv4,Ingress LSR ID的前10字節填充為0x00,接著的2字節填充為0xFF,最後4字節為IPv4地址 |
Padding | 填充字段,取值為全0 |
BIP16 | 報文校驗和 |
MPLS OAM FFD報文同CV報文一樣,也是由入節點發送,通過被檢測的LSP到達出節點,以此進行LSP的連通性檢測。其格式如圖 2。
同CV報文相比,FFD報文中多了一個字節的頻率信息。CV報文采用固定1s的發送周期,而FFD報文可支持10ms、20ms、50ms、100ms、200ms和500ms多種發送頻率,在不同的產品中可以根據需求來改變支持的頻率值。
圖 2 MPLS OAM FFD報文格式
圖 2中各字段含義如表 2所示。
表 2 MPLS OAM FFD報文字段含義
字段 | 描述 |
Function type | 報文類型,0x07代表FFD報文 |
Reserved | 保留字段,取值為全0 |
LSP trail termination source identifier | TTSI,請參見1. 圖 1表 1 |
Frequency | FFD報文發送頻率 |
Padding | 填充字段,取值為全0 |
BIP16 | 報文校驗和 |
MPLS OAM BDI報文用於LSP的出節點在發現LSP缺陷後,將缺陷信息通過反向通道告知LSP的入節點,其格式如圖 3。
圖 3 MPLS OAM BDI報文格式
圖 3中各字段含義如表 3所示。
表 3 MPLS OAM BDI報文字段含義
字段 | 描述 |
Function type | 報文類型,0x03代表BDI報文 |
Reserved | 保留字段,取值為全0 |
Defect type | LSP缺陷類型 |
TTSI | LSP標識,請參見1. 圖 1表 1;如果不使用TTSI,該字段各字節填充為0x00 |
Defect location | 缺陷定位信息 |
Padding | 填充字段,取值為全0 |
BIP16 | 報文校驗和 |
圖 4 MPLS OAM連通性檢測示意圖
MPLS OAM基本檢測功能主要用來檢測連通性,工作過程如圖 4所示:
(1) 入節點發送CV/FFD報文,報文通過被檢測的LSP到達出節點;
(2) 出節點把接收到的報文類型、頻率、TTSI等信息字段與本地記錄的對應值相比較來判斷報文的正誤,並統計檢測周期內收到的正確報文與錯誤報文的數量,從而對LSP的連通性隨時進行監控;
(3) 當出節點檢測到LSP缺陷後,分析出缺陷類型,通過反向通道將攜帶缺陷信息的BDI報文發送給入節點,從而使入節點及時獲知缺陷狀態。如果正確配置了保護組,則還會觸發相應的保護倒換。
在配置MPLS OAM基本檢測功能時,需要為被檢測LSP綁定一個反向通道。反向通道是與被檢測LSP具有相反的入節點和出節點的LSP。承載BDI報文的反向通道,有以下兩種類型:
l 獨占反向LSP。每條前向LSP都有自己的反向LSP,這種方法相對穩定,但可能造成資源浪費。
l 共享反向LSP。多條前向LSP共用一條反向LSP,所有LSP返回BDI報文均通過這一條反向LSP,這種方法可以減少資源浪費,但當多條前向LSP同時出現缺陷時,這條反向LSP上可能會出現擁堵。
當LSP入節點晚於出節點開啟MPLS OAM功能,或出節點開啟而入節點不開啟MPLS OAM功能時,會造成出節點的LOCV(Loss of Connectivity Verification defect,連通性檢測缺陷)告警。可以通過首包觸發功能解決這個問題。
所謂首包觸發功能,是指出節點在超時等待時間(OverTime)內接收到第一個CV/FFD報文,以此時作為連通性檢測的起點;如果出節點在配置MPLS OAM功能的OverTime時間後,沒有接收到CV/FFD報文,則產生BDI報文。
RLSN(Remote Link Status Notification,遠程鏈路狀態通告)功能是指LSP出節點可以監控某一個接口的狀態。監控的接口可以是出節點上的任意一個接口。
l 當接口down時,觸發擴展BDI報文通知入節點,入節點不會通知保護倒換,但記錄RLSN狀態信息,以便用戶查詢。
l 當接口重新up時,停止發送擴展BDI報文,入節點不會通知保護倒換,但記錄RLSN狀態信息,以便用戶查詢。
PS(Protection Switching,保護倒換)是為主Tunnel建立相應的保護Tunnel(備用Tunnel)。主Tunnel和備用Tunnel構成一個保護組。在主Tunnel發生缺陷時,數據流能迅速的倒換到備用Tunnel,從而大大提高網絡的可靠性。
設備目前實現的保護倒換為1:1保護倒換。在Tunnel的入節點和出節點之間提供主備兩條Tunnel。正常情況下,數據在主Tunnel上傳輸;當入節點通過檢測機製(如MPLS OAM)發現主Tunnel發生缺陷,需要進行保護倒換時,將數據切換到備用Tunnel上繼續傳輸。
保護倒換分為外部倒換和信令倒換。
(1) 外部倒換是指通過手工配置的命令觸發的保護倒換。外部倒換的優先級由高到低為:
l 清除倒換(Clear):清除所有的外部倒換命令。
l 鎖定倒換(Lockout of Protection):數據流鎖定在主LSP上傳輸。
l 強製倒換(Forced Switch):數據流強製在備份LSP上傳輸。
l 手工倒換(Manual Switch):將數據流手動倒換到主/備LSP上傳輸。
(2) 信令倒換(Signal Fail)是指通過協議信令觸發的保護倒換。信令倒換包括配置了MPLS OAM基本檢測功能後,主備Tunnel之間的倒換以及檢測隧道up/down消息觸發的倒換等。
在實際操作中,隻有在手工輸入的外部倒換命令比當前信令優先級高的情況下,外部倒換才會生效。
外部倒換命令及信令倒換優先級從高到低依次為:
l 清除倒換
l 鎖定倒換
l 強製倒換
l 信令倒換
l 手工倒換