以太網技術自誕生起,以其簡單易用、價格低廉等特點逐步成為局域網的主導技術。近年來,隨著千兆、萬兆以太網技術的相繼應用,以太網已經向城域網和廣域網方向擴展。
由於以太網最初主要應用於局域網,而局域網對可靠性和穩定性的要求都較低,因此以太網一直缺乏有效的管理維護機製,這已成為以太網應用於城域網和廣域網的嚴重障礙。因此,在以太網上實現OAM(Operation, Administration and Maintenance,操作、管理和維護)成為必然的發展趨勢。以太網OAM是一種監控網絡故障的工具,目前主要用於解決以太網接入“最後一公裏”中常見的鏈路問題。用戶通過在兩個點到點連接的設備上啟用以太網OAM功能,可以監控這兩台設備之間的鏈路狀態。
以太網OAM能夠有效提高以太網的管理和維護能力,保障網絡的穩定運行,其主要功能包括:
l 鏈路性能監測:對鏈路的各種性能進行監測,包括對丟包、時延和抖動等的衡量,以及對各類流量的統計;
l 故障偵測和告警:通過發送檢測報文來探測鏈路的連通性,當鏈路出現故障時及時通知網絡管理員;
l 環路測試:通過非以太網OAM協議報文的環回來檢測鏈路故障。
以太網OAM工作在數據鏈路層,其協議報文被稱為OAMPDU(OAM Protocol Data Units,OAM協議數據單元)。以太網OAM就是通過設備之間定時交互OAMPDU來報告鏈路狀態,使網絡管理員能夠對網絡進行有效的管理。
如圖 1所示,是幾種常見OAMPDU的報文格式,各重要字段的含義如表 1所示。
表 1 OAMPDU重要字段含義
字段 | 含義 |
Dest addr | 以太網OAM報文目的MAC地址,為慢協議組播地址:0x0180-C200-0002。由於慢協議報文不能被網橋轉發,因此以太網OAM報文也不能被轉發 |
Source addr | 以太網OAM報文源MAC地址,為發送端的橋MAC地址,是一個單播MAC地址 |
Type | 以太網OAM報文的協議類型,為0x8809 |
Subtype | 以太網OAM報文的協議子類型,為0x03 |
Flags | Flag域,包含了以太網OAM實體的狀態信息 |
Code | OAMPDU報文的類型 |
我們稱使能了以太網OAM功能的端口為“以太網OAM實體”,簡稱“OAM實體”。
圖 1中幾類OAMPDU報文的作用如表 2所示。
表 2 各類OAMPDU報文的作用
報文類型 | 中文含義 | 作用 |
Information OAMPDU | 信息OAMPDU | 用於將OAM實體的狀態信息(包括本地信息、遠端信息和自定義信息)發給遠端OAM實體,以保持以太網OAM連接 |
Event Notification OAMPDU | 事件通知OAMPDU | 一般用於鏈路監控,對連接本端和遠端OAM實體的鏈路上所發生的故障進行告警 |
Loopback Control OAMPDU | 環回控製OAMPDU | 主要用於遠端環回控製,用來控製遠端設備的OAM環回狀態,該報文中帶有使能或去使能環回功能的信息,根據該信息開啟或關閉遠端環回功能 |
以太網OAM功能建立在以太網OAM連接的基礎上,下麵對以太網OAM的工作流程進行簡要介紹。
以太網OAM連接的建立過程也稱為Discovery階段,即本端OAM實體發現遠端OAM實體、並與之建立穩定對話的過程。
在這個過程中,相連的OAM實體通過交互Information OAMPDU通報各自的以太網OAM配置信息和本端支持的以太網OAM能力信息。當OAM實體收到對端的配置參數後,決定是否建立OAM連接。當兩端OAM實體對Loopback功能、單向鏈路檢測及鏈路事件等配置信息的檢查都通過之後,以太網OAM協議開始正常工作。
以太網OAM的連接模式有兩種:主動模式和被動模式,在這兩種模式下設備的處理能力如表 3所示。
處理能力 | 主動模式 | 被動模式 |
初始化以太網OAM Discovery過程 | 可以 | 不可以 |
對以太網OAM Discovery初始化過程的響應 | 可以 | 可以 |
發送Information OAMPDU | 可以 | 可以 |
發送Event Notification OAMPDU | 可以 | 可以 |
發送不攜帶TLV的Information OAMPDU | 可以 | 可以 |
發送Loopback Control OAMPDU | 可以 | 不可以 |
對Loopback Control OAMPDU的響應 | 可以,但需要對端為主動模式 | 可以 |
l 以太網OAM連接隻能由主動模式的OAM實體發起,而被動模式的OAM實體隻能等待對端OAM實體的連接請求。
l 都處於被動模式下的兩個OAM實體之間無法建立以太網OAM連接。
以太網OAM連接建立後,兩端的OAM實體會以一定的時間間隔為周期發送Information OAMPDU來檢測連接是否正常,該間隔被稱為握手報文發送間隔。如果一端OAM實體在連接超時時間內未收到對端OAM實體發來的Information OAMPDU,則認為OAM連接中斷。
以太網的故障檢測非常困難,特別是在網絡物理通信沒有中斷而網絡性能緩慢下降的情況下。鏈路監控用於在各種環境下檢測和發現鏈路層故障,以太網OAM通過交互Event Notification OAMPDU來監控鏈路:當一端OAM實體監控到一般鏈路事件(其所含類型如表 4所示)時,將向其對端發送Event Notification OAMPDU以進行通報,管理員可以通過觀察日誌信息動態地掌握網絡的狀況。
事件類型 | 描述 |
錯誤信號事件(Errored Symbol Event) | 單位時間內的錯誤信號數量超過定義的閾值 |
錯誤幀事件(Errored Frame Event) | 單位時間內的錯誤幀數量超過定義的閾值 |
錯誤幀周期事件(Errored Frame Period Event) | 指定幀數N為周期,在收到N個幀的周期內錯誤幀數超過定義的閾值 |
錯誤幀秒數事件(Errored Frame Seconds Event) | 指定M秒數下有錯誤幀的秒數超過了定義的閾值 |
l 錯誤幀周期事件的檢測周期將被係統轉換為某端口在該周期內能發送64字節幀的最大幀數,即以最大幀數作為周期,其計算公式為:最大幀數=接口帶寬(bps)×錯誤幀周期事件的檢測周期(ms)÷(64×8×1000)。
l 錯誤幀秒:如果在某一秒內發生了錯誤幀,則將該秒稱為錯誤幀秒。
在以太網OAM連接已建立的情況下,兩端的OAM實體會不斷交互Information OAMPDU。當設備故障或不可用導致流量中斷時,故障端OAM實體會通過Information OAMPDU中的Flag域將故障信息(即緊急鏈路事件類型)通知給對端OAM實體。這樣,管理員可以通過觀察日誌信息動態地了解鏈路狀態,對相應的錯誤及時進行處理。緊急鏈路事件的類型及其對應的Information OAMPDU發送頻率如表 5所示。
事件類型 | 描述 | OAMPDU發送頻率 |
鏈路故障(Link Fault) | 對端鏈路信號丟失 | 每秒發送一次 |
致命故障(Dying Gasp) | 不可預知的狀態發生,比如電源中斷 | 不間斷發送 |
緊急事件(Critical Event) | 不能確定的緊急事件發生 | 不間斷發送 |
遠端環回是指主動模式下的OAM實體向對端(遠端)發送除OAMPDU以外的所有其它報文時,對端收到報文後不按其目的地址進行轉發,而是將其按原路返回給本端。遠端環回隻有在以太網OAM連接建立之後才能實現。
遠端環回功能可用於檢測鏈路質量和定位鏈路故障。定期進行環回檢測可以及時發現網絡故障,並可通過分段環回檢測來定位故障發生的具體區域。