01-以太網OAM配置
本章節下載: 01-以太網OAM配置 (330.10 KB)
目 錄
以太網OAM(Operation, Administration, and Maintenance,操作、管理和維護)是一種監控網絡故障的工具,主要用於解決以太網接入“最後一公裏”中常見的鏈路問題,能夠有效提高以太網的管理和維護能力,保障網絡的穩定運行。用戶通過在兩個點到點連接的設備上啟用以太網OAM功能,可以監控這兩台設備之間的鏈路狀態。
以太網OAM的主要功能包括:
· 鏈路性能監測:對鏈路的各種性能進行監測,包括對丟包、時延和抖動等數據的衡量,以及對各類流量的統計。
· 故障偵測和告警:通過發送檢測報文來探測鏈路的連通性,當鏈路出現故障時及時通知網絡管理員。
· 環路測試:通過監測所發出報文的返回情況來檢測鏈路質量和定位鏈路故障。
以太網OAM工作在數據鏈路層,其協議報文被稱為OAMPDU(OAM Protocol Data Unit,OAM協議數據單元)。以太網OAM就是通過設備之間定時交互OAMPDU來報告鏈路狀態,使網絡管理員能夠對網絡進行有效的管理。幾種常見的OAMPDU及其作用如表1-1所示。
表1-1 常見的OAMPDU及其作用
報文類型 |
中文含義 |
作用 |
Information OAMPDU |
信息OAMPDU |
用於將OAM實體的狀態信息(包括本地信息、遠端信息和自定義信息)發給遠端OAM實體,以保持以太網OAM連接 |
Event Notification OAMPDU |
事件通知OAMPDU |
一般用於鏈路監控,對連接本端和遠端OAM實體的鏈路上所發生的故障進行告警 |
Loopback Control OAMPDU |
環回控製OAMPDU |
主要用於遠端環回控製,用來控製遠端設備的OAM環回狀態,該報文中帶有開啟或關閉環回功能的信息,根據該信息開啟或關閉遠端環回功能 |
開啟了以太網OAM功能的接口稱為“以太網OAM實體”,簡稱“OAM實體”。
以太網OAM連接的建立過程也稱為Discovery階段,即本端OAM實體發現遠端OAM實體、並與之建立穩定對話的過程。
在這個過程中,相連的OAM實體通過交互Information OAMPDU通報各自的以太網OAM配置信息和本端支持的以太網OAM能力信息。當OAM實體收到遠端的配置參數後,決定是否建立OAM連接。當兩端OAM實體對遠端環回功能、單向鏈路檢測及鏈路事件等配置信息的檢查都通過之後,以太網OAM協議開始正常工作。
以太網OAM的連接模式有兩種:主動模式和被動模式。以太網OAM連接隻能由主動模式的OAM實體發起,而被動模式的OAM實體隻能等待遠端OAM實體的連接請求;同處於被動模式下的兩個OAM實體之間無法建立以太網OAM連接。在這兩種模式下設備的處理能力如表1-2所示。
處理能力 |
主動模式 |
被動模式 |
初始化以太網OAM Discovery過程 |
可以 |
不可以 |
對以太網OAM Discovery初始化過程的響應 |
可以 |
可以 |
發送Information OAMPDU |
可以 |
可以 |
發送Event Notification OAMPDU |
可以 |
可以 |
發送不攜帶TLV的Information OAMPDU |
可以 |
可以 |
發送Loopback Control OAMPDU |
可以 |
不可以 |
對Loopback Control OAMPDU的響應 |
可以 |
可以 |
以太網OAM連接建立後,兩端的OAM實體會以一定的時間間隔為周期發送Information OAMPDU來檢測連接是否正常,該間隔被稱為握手報文發送間隔。如果一端OAM實體在連接超時時間內未收到遠端OAM實體發來的Information OAMPDU,則認為OAM連接中斷。
以太網的故障檢測非常困難,特別是在網絡物理通信沒有中斷而網絡性能緩慢下降的情況下。鏈路監控用於在各種環境下檢測和發現鏈路層故障,以太網OAM通過交互Event Notification OAMPDU來監控鏈路:當一端OAM實體監控到一般鏈路事件(其所含類型如表1-3所示)時,將向其遠端發送Event Notification OAMPDU以進行通報,管理員可以通過觀察日誌信息動態地掌握網絡的狀況。
事件類型 |
描述 |
錯誤信號事件(Errored Symbol Event) |
以收到設定數量的信號為檢測窗口,在窗口期內檢測到的錯誤信號數量如果達到或超過了檢測閾值,就產生一次錯誤信號事件 |
錯誤幀事件(Errored Frame Event) |
以設定的時間為檢測窗口,在窗口期內檢測到的錯誤幀數量如果達到或超過了檢測閾值,就產生一次錯誤幀事件 |
錯誤幀周期事件(Errored Frame Period Event) |
以收到設定數量的幀為檢測窗口,在窗口期內檢測到的錯誤幀數量如果達到或超過了檢測閾值,就產生一次錯誤幀周期事件 |
錯誤幀秒事件(Errored Frame Seconds Event) |
以設定的時間為檢測窗口,在窗口期內檢測到的錯誤幀秒(在某一秒內檢測到至少一個錯誤幀,就稱該秒為錯誤幀秒)數量如果達到或超過了檢測閾值,就產生一次錯誤幀秒事件 |
在以太網OAM連接已建立的情況下,兩端的OAM實體會不斷交互Information OAMPDU。當設備故障或不可用導致流量中斷時,故障端OAM實體會通過Information OAMPDU中的Flag域將故障信息(即緊急鏈路事件類型)通知給遠端OAM實體。這樣,管理員可以通過觀察日誌信息動態地了解鏈路狀態,對相應的錯誤及時進行處理。緊急鏈路事件的類型及其對應的Information OAMPDU發送頻率如表1-4所示。
事件類型 |
描述 |
OAMPDU發送頻率 |
鏈路故障(Link Fault) |
遠端鏈路信號丟失 |
每秒發送一次 |
致命故障(Dying Gasp) |
不可預知的狀態發生,比如電源中斷 |
不間斷發送 |
緊急事件(Critical Event) |
不能確定的緊急事件發生 |
不間斷發送 |
遠端環回是指主動模式下的OAM實體向遠端發送除OAMPDU以外的所有其它報文時,遠端收到報文後不按其目的地址進行轉發,而是將其按原路返回給本端。遠端環回隻有在以太網OAM連接建立之後才能實現。
遠端環回功能可用於檢測鏈路質量和定位鏈路故障。定期進行環回檢測可以及時發現網絡故障,並可通過分段進行環回檢測來定位故障發生的具體區域。
與以太網OAM相關的協議規範有:
· IEEE 802.3ah:Carrier Sense Multiple Access with Collision Detection (CSMA/CD) Access Method and Physical Layer Specifications
設備對收、發攜帶有緊急鏈路事件的Information OAMPDU的支持情況如下:
· 支持接收攜帶所有類型緊急鏈路事件的Information OAMPDU。
· 支持發送攜帶鏈路故障事件的Information OAMPDU。
· 僅支持在設備重啟或接口被shutdown時發送攜帶致命故障事件的Information OAMPDU,但IRF物理接口不支持發送該報文。
· 不支持發送攜帶緊急事件的Information OAMPDU。
以太網OAM配置任務如下:
(1) 配置以太網OAM基本功能
(2) (可選)配置以太網OAM連接檢測定時器
(3) (可選)配置一般鏈路事件檢測參數
(4) (可選)配置對遠端以太網OAM事件的響應動作
(5) (可選)配置以太網OAM遠端環回功能
以太網OAM的連接模式分為主動和被動模式,當開啟了以太網OAM功能之後,以太網接口開始使用預設的連接模式與其遠端接口建立以太網OAM連接。
不允許在已開啟以太網OAM功能的接口上更改以太網OAM的連接模式。如需更改,請先關閉該接口上的以太網OAM功能。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 配置以太網OAM的連接模式。
oam mode { active | passive }
缺省情況下,以太網OAM連接模式為主動模式。
(4) 開啟以太網OAM功能。
oam enable
缺省情況下,以太網OAM功能處於關閉狀態。
以太網OAM連接建立後,兩端的OAM實體會以一定的時間間隔為周期發送Information OAMPDU來檢測連接是否正常,該間隔被稱為握手報文發送間隔。如果一端OAM實體在連接超時時間內未收到遠端OAM實體發來的Information OAMPDU,則認為OAM連接中斷。通過調整握手報文發送間隔和連接超時時間,可以改變以太網OAM連接的檢測精度。
用戶既可在係統視圖下配置對所有接口都有效的全局值,也可在接口視圖下配置隻對當前接口有效的接口值,後者的配置優先級更高。
由於本端OAM實體在連接超時後將老化與遠端OAM實體的連接關係,導致OAM連接中斷,因此連接超時時間必須大於握手報文發送間隔(建議為五倍或以上),否則將導致以太網OAM連接不穩定。
(1) 進入係統視圖。
system-view
(2) 全局配置以太網OAM握手報文的發送間隔。
oam global timer hello interval
缺省情況下,以太網OAM握手報文發送間隔的全局值為1000毫秒。
(3) 全局配置以太網OAM連接的超時時間。
oam global timer keepalive interval
缺省情況下,以太網OAM連接超時時間的全局值為5000毫秒。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 在接口上配置以太網OAM握手報文的發送間隔。
oam timer hello interval
缺省情況下,接口采用全局值。
(4) 在接口上配置以太網OAM連接的超時時間。
oam timer keepalive interval
缺省情況下,接口采用全局值。
用戶既可在係統視圖下配置對所有接口都有效的全局值,也可在接口視圖下配置隻對當前接口有效的接口值,後者的配置優先級更高。
(1) 進入係統視圖。
system-view
(2) 全局配置錯誤信號事件的檢測窗口。
oam global errored-symbol-period window window-value
缺省情況下,錯誤信號事件檢測窗口的全局值為100000000次。
(3) 全局配置錯誤信號事件的檢測閾值。
oam global errored-symbol-period threshold threshold-value
缺省情況下,錯誤信號事件檢測閾值的全局值為1次。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 在接口上配置錯誤信號事件的檢測窗口。
oam errored-symbol-period window window-value
缺省情況下,接口采用全局值。
(4) 在接口上配置錯誤信號事件的檢測閾值。
oam errored-symbol-period threshold threshold-value
缺省情況下,接口采用全局值。
用戶既可在係統視圖下配置對所有接口都有效的全局值,也可在接口視圖下配置隻對當前接口有效的接口值,後者的配置優先級更高。
(1) 進入係統視圖。
system-view
(2) 全局配置錯誤幀事件的檢測窗口。
oam global errored-frame window window-value
缺省情況下,錯誤幀事件檢測窗口的全局值為1000毫秒。
(3) 全局配置錯誤幀事件的檢測閾值。
oam global errored-frame threshold threshold-value
缺省情況下,錯誤幀事件檢測閾值的全局值為1次。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 在接口上配置錯誤幀事件的檢測窗口。
oam errored-frame window window-value
缺省情況下,接口采用全局值。
(4) 在接口上配置錯誤幀事件的檢測閾值。
oam errored-frame threshold threshold-value
缺省情況下,接口采用全局值。
用戶既可在係統視圖下配置對所有接口都有效的全局值,也可在接口視圖下配置隻對當前接口有效的接口值,後者的配置優先級更高。
(1) 進入係統視圖。
system-view
(2) 全局配置錯誤幀周期事件的檢測窗口。
oam global errored-frame-period window window-value
缺省情況下,錯誤幀周期事件檢測窗口的全局值為10000000次。
(3) 全局配置錯誤幀周期事件的檢測閾值。
oam global errored-frame-period threshold threshold-value
缺省情況下,錯誤幀周期事件檢測閾值的全局值為1次。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 在接口上配置錯誤幀周期事件的檢測窗口。
oam errored-frame-period window window-value
缺省情況下,接口采用全局值。
(4) 在接口上配置錯誤幀周期事件的檢測閾值。
oam errored-frame-period threshold threshold-value
缺省情況下,接口采用全局值。
用戶既可在係統視圖下配置對所有接口都有效的全局值,也可在接口視圖下配置隻對當前接口有效的接口值,後者的配置優先級更高。
在數量上,錯誤幀秒事件的檢測閾值不應大於其檢測窗口值(換算成秒),否則將不會產生錯誤幀秒事件。
(1) 進入係統視圖。
system-view
(2) 全局配置錯誤幀秒事件的檢測窗口。
oam global errored-frame-seconds window window-value
缺省情況下,錯誤幀秒事件檢測窗口的全局值為60000毫秒。
(3) 全局配置錯誤幀秒事件的檢測閾值。
oam global errored-frame-seconds threshold threshold-value
缺省情況下,錯誤幀秒事件檢測閾值的全局值為1次。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 在接口上配置錯誤幀秒事件的檢測窗口。
oam errored-frame-seconds window window-value
缺省情況下,接口采用全局值。
(4) 在接口上配置錯誤幀秒事件的檢測閾值。
oam errored-frame-seconds threshold threshold-value
缺省情況下,接口采用全局值。
通過本配置可以使接口在收到遠端以太網OAM事件時除了記錄日誌外,還會自動斷開OAM連接,並設置該接口的鏈路層狀態為down。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 配置接口收到遠端以太網OAM事件時的響應動作。
oam remote-failure { connection-expired | critical-event | dying-gasp | link-fault } action error-link-down
缺省情況下,接口收到遠端以太網OAM事件後僅記錄日誌。
在本端接口上開啟了以太網OAM遠端環回功能之後,該接口將向遠端接口發送Loopback Control OAMPDU,使遠端進入OAM環回狀態。然後,遠端會返回本端發送來的報文(除OAMPDU以外),用戶可以通過觀察這些報文的返回情況來計算鏈路丟包率,以此來評判鏈路性能。
由於遠端環回功能將使正常業務受到影響,因此請慎重開啟該功能。
隻有當接口上的以太網OAM連接已建立完成,且以太網OAM的連接模式為主動模式時,才允許在該接口上開啟以太網OAM遠端環回功能。
隻有本端和遠端接口都支持遠端環回功能、且在全雙工鏈路上才能實現遠端環回功能。
在開啟遠端環回時,將引起所有數據流量的中斷;當退出遠端環回後,接口將自動執行一次先關閉再開啟的操作。導致接口退出遠端環回的原因有:關閉接口上的以太網OAM功能、關閉接口上的以太網OAM遠端環回功能或OAM連接超時等。
如果在遠端環回過程中開啟了內部環回功能,遠端環回將終止。有關環回功能的詳細介紹,請參見“接口管理配置指導”中的“以太網接口”。
在開啟以太網OAM遠端環回功能時,請勿配置聚合管理VLAN,否則將導致以太網OAM遠端環回功能不能正常工作。有關聚合管理VLAN的詳細介紹,請參見“二層技術-以太網交換配置指導”中的“以太網鏈路聚合”。
用戶既可在用戶視圖或係統視圖下開啟指定接口的以太網OAM遠端環回功能,也可在接口視圖下開啟當前接口的以太網OAM遠端環回功能,三者的配置效果相同。
請勿在使能OAM遠端環回功能的端口上再使能生成樹功能,關於生成樹的詳細信息,請參見“二層技術-以太網交換配置指導”中的“生成樹”。
聚合成員端口不支持配置以太網OAM遠端環回功能。
(1) (可選)進入係統視圖。
system-view
用戶也可以在用戶視圖下執行以下任務。
(2) 開啟指定接口的以太網OAM遠端環回功能。
oam remote-loopback start interface interface-type interface-number
缺省情況下,以太網OAM遠端環回功能處於關閉狀態。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 開啟當前接口的以太網OAM遠端環回功能。
oam remote-loopback start
缺省情況下,以太網OAM遠端環回功能處於關閉狀態。
由於遠端環回功能會使正常業務受到影響,為了避免這種情況,用戶可通過本配置使本端接口不受遠端發來的Loopback Control OAMPDU的控製,從而拒絕其發起的以太網OAM遠端環回。
在執行本配置時若接口已處於環回狀態,則該配置將從下次環回開始時生效。
(1) 進入係統視圖。
system-view
(2) 進入二層以太網接口視圖。
interface interface-type interface-number
(3) 配置接口拒絕遠端發起的以太網OAM遠端環回。
oam remote-loopback reject-request
缺省情況下,接口不拒絕遠端發起的以太網OAM遠端環回。
在完成上述配置後,在任意視圖下執行display命令可以顯示配置後以太網OAM的運行情況,通過查看顯示信息驗證配置的效果。
在用戶視圖下執行reset命令可以清除以太網OAM的統計信息。
表1-5 以太網OAM顯示和維護
操作 |
命令 |
顯示以太網OAM連接的信息 |
display oam { local | remote } [ interface interface-type interface-number ] |
顯示以太網OAM的配置信息 |
display oam configuration [ interface interface-type interface-number ] |
顯示以太網OAM的緊急鏈路事件統計信息 |
display oam critical-event [ interface interface-type interface-number ] |
顯示以太網OAM的一般鏈路事件統計信息 |
display oam link-event { local | remote } [ interface interface-type interface-number ] |
清除以太網OAM的報文和一般鏈路事件統計信息 |
reset oam [ interface interface-type interface-number ] |
· 通過在Device A和Device B上配置以太網OAM功能,實現二者之間鏈路連通性故障的自動檢測。
· 通過觀察Device A上收到錯誤幀的情況,來評判Device A與Device B之間的鏈路性能。
圖1-1 以太網OAM典型配置組網圖
(1) 配置Device A
# 在接口GigabitEthernet1/0/1上配置以太網OAM的連接模式為主動模式,並開啟其以太網OAM功能。
<DeviceA> system-view
[DeviceA] interface gigabitethernet 1/0/1
[DeviceA-GigabitEthernet1/0/1] oam mode active
[DeviceA-GigabitEthernet1/0/1] oam enable
# 在接口GigabitEthernet1/0/1上配置錯誤幀事件的檢測窗口為20000毫秒,檢測閾值為10次。
[DeviceA-GigabitEthernet1/0/1] oam errored-frame window 200
[DeviceA-GigabitEthernet1/0/1] oam errored-frame threshold 10
[DeviceA-GigabitEthernet1/0/1] quit
(2) 配置Device B
# 在接口GigabitEthernet1/0/1上配置以太網OAM的連接模式為被動模式,並開啟其以太網OAM功能。
<DeviceB> system-view
[DeviceB] interface gigabitethernet 1/0/1
[DeviceB-GigabitEthernet1/0/1] oam mode passive
[DeviceB-GigabitEthernet1/0/1] oam enable
[DeviceB-GigabitEthernet1/0/1] quit
通過使用display oam critical-event命令可以顯示以太網OAM的緊急鏈路事件統計信息,例如:
# 顯示Device A所有接口上以太網OAM的緊急鏈路事件統計信息。
[DeviceA] display oam critical-event
----------- [GigabitEthernet1/0/1] -----------
Local link status : UP
Event statistics
Link fault : Not occurred
Dying gasp : Not occurred
Critical event : Not occurred
以上信息表明:Device A與Device B之間的鏈路上尚未發生任何緊急鏈路事件。
通過使用display oam link-event命令可以顯示以太網OAM的一般鏈路事件統計信息,例如:
# 顯示Device A所有接口上以太網OAM的一般鏈路事件的本端統計信息。
[DeviceA] display oam link-event local
----------- [GigabitEthernet1/0/1] -----------
Link status: UP
OAM local errored frame event
Event time stamp : 5789 x 100 milliseconds
Errored frame window : 200 x 100 milliseconds
Errored frame threshold : 10 error frames
Errored frame : 13 error frames
Error running total : 350 error frames
Event running total : 17 events
以上信息表明:從Device A開始運行時起,總共有350個錯誤幀,產生了17次錯誤幀事件,鏈路性能並不穩定。
不同款型規格的資料略有差異, 詳細信息請向具體銷售和400谘詢。H3C保留在沒有任何通知或提示的情況下對資料內容進行修改的權利!