IRF2.0技術介紹


IRF2.0

H3C一直致力於IRF技術的研發和優化,繼推出IRF1.0之後,現又推出了具有更加完善功能的通用虛擬化技術IRF2.0。本文將對IRF2.0技術進行簡要介紹。

 

IRF簡介

IRF概述

IRFIntelligent Resilient Framework,智能彈性架構)是H3C自主研發的軟件虛擬化技術。它的核心思想是將多台設備通過IRF物理端口連接在一起,進行必要的配置後,虛擬化成一台“分布式設備”。使用這種虛擬化技術可以實現多台設備的協同工作、統一管理和不間斷維護。

為了便於描述,這個“虛擬設備”也稱為IRF。所以,本文中的IRF有兩層意思,一個是指IRF技術,一個是指IRF設備。

IRF的優點

IRF主要具有以下優點:

l   簡化管理。IRF形成之後,用戶通過任意成員設備的任意端口都可以登錄IRF係統,對IRF內所有成員設備進行統一管理。

l   高可靠性。IRF的高可靠性體現在多個方麵,例如:IRF由多台成員設備組成,Master設備負責IRF的運行、管理和維護,Slave設備在作為備份的同時也可以處理業務。一旦Master設備故障,係統會迅速自動選舉新的Master,以保證業務不中斷,從而實現了設備的1:N備份;此外,成員設備之間的IRF鏈路支持聚合功能,IRF和上、下層設備之間的物理鏈路也支持聚合功能,多條鏈路之間可以互為備份也可以進行負載分擔,從而進一步提高了IRF的可靠性。

l   強大的網絡擴展能力。通過增加成員設備,可以輕鬆自如的擴展IRF的端口數、帶寬。因為各成員設備都有CPU,能夠獨立處理協議報文、進行報文轉發,所以IRF還能夠輕鬆自如的擴展處理能力。

IRF的應用

1所示,MasterSlave組成IRF,對上、下層設備來說,它們就是一台設備——IRFIRF可部署在核心層、彙聚層和接入層。

圖 1 IRF組網應用示意圖

 

IRF基本概念

IRF虛擬化技術涉及如下基本概念:

1. 運行模式

設備支持兩種運行模式:

l   獨立運行模式:處於該模式下的設備隻能單機運行,不能與別的設備形成IRF

l   IRF模式:處於該模式下的設備可以與其它設備互連形成IRF

兩種模式之間通過命令行進行切換。

2. 角色

IRF中每台設備都稱為成員設備。成員設備按照功能不同,分為兩種角色:

l   Master:負責管理整個IRF

l   Slave:作為Master的備份設備運行。當Master故障時,係統會自動從Slave中選舉一個新的Master接替原Master工作。

MasterSlave均由角色選舉產生。一個IRF中同時隻能存在一台Master,其它成員設備都是Slave。關於設備角色選舉過程的詳細介紹請參見角色選舉章節。

3. IRF端口

一種專用於IRF的邏輯接口,分為IRF-Port1IRF-Port2。它需要和物理端口綁定之後才能生效。

在獨立運行模式下,IRF端口分為IRF-Port1IRF-Port2;在IRF模式下,IRF端口分為IRF-Portn/1IRF-Portn/2,其中n為設備的成員編號。為簡潔起見,本文描述時統一使用IRF-Port1IRF-Port2

 

4. IRF物理端口

設備上可以用於IRF連接的物理端口。IRF物理端口可能是IRF專用接口、以太網接口或者光口。

通常情況下,以太網接口或者光口負責向網絡中轉發業務報文,當它們與IRF端口綁定後就作為IRF物理端口,用於成員設備之間轉發報文。可轉發的報文包括IRF相關協商報文以及需要跨成員設備轉發的業務報文。

5. IRF合並

2所示,兩個IRF各自已經穩定運行,通過物理連接和必要的配置,形成一個IRF,這個過程稱為IRF合並(merge)。

圖 2 IRF合並示意圖

 

6. IRF分裂

3所示,一個IRF形成後,由於IRF鏈路故障,導致IRF中兩相鄰成員設備物理上不連通,一個IRF變成兩個IRF,這個過程稱為IRF分裂(split)。

圖 3 IRF分裂示意圖

 

7. 成員優先級

成員優先級是成員設備的一個屬性,主要用於角色選舉過程中確定成員設備的角色。優先級越高當選為Master的可能性越大。

IRF工作原理

IRF的生命周期分為:物理連接拓撲收集角色選舉IRF管理與維護四個階段。成員設備之間需要先建立IRF物理連接,然後會自動進行拓撲收集和角色選舉,處理成功後,IRF係統正常運行,進入IRF管理和維護階段。

物理連接

要形成一個IRF,需要先按照以下規則連接IRF物理端口:

本設備上與IRF-Port1綁定的IRF物理端口隻能和鄰居成員設備IRF-Port2口上綁定的IRF物理端口相連,本設備上與IRF-Port2口綁定的IRF物理端口隻能和鄰居成員設備IRF-Port1口上綁定的IRF物理端口相連,如 4所示。否則,不能形成IRF

圖 4 IRF物理連接示意圖

 

拓撲收集

每個成員設備都在本地記錄自己已知的拓撲信息,通過和鄰居成員設備交互IRF Hello報文來收集整個IRF的拓撲。

(1)      初始時刻,成員設備隻記錄了自身的拓撲信息;

(2)      IRF端口狀態變為up後,成員設備會將已知的拓撲信息周期性的發送出去;

(3)      成員設備收到鄰居的拓撲信息後,會更新本地記錄的拓撲信息。

經過一段時間的收集,所有設備上都會收集到完整的拓撲信息(稱為拓撲收斂)。此時會進入角色選舉階段。

角色選舉

確定成員設備角色為MasterSlave的過程稱為角色選舉。

角色選舉會在拓撲變更的情況下產生,比如IRF建立、新設備加入、Master設備離開或者故障、兩個IRF合並等。角色選舉規則如下:

(1)      當前Master優先(IRF係統形成時,沒有Master設備,所有加入的設備都認為自己是Master,會跳轉到第二條規則繼續比較);

(2)      成員優先級大的優先;

(3)      係統運行時間長的優先(各設備的係統運行時間信息也是通過IRF Hello報文來傳遞的);

(4)      MAC地址小的優先。

從第一條開始判斷,如果判斷的結果是多個最優,則繼續判斷下一條,直到找到唯一最優的成員設備才停止比較。此最優成員設備即為Master,其它成員設備則均為Slave

在角色選舉完成後,IRF形成,進入IRF管理與維護階段。

IRF合並的情況下,兩個IRF會進行IRF競選,競選仍然遵循角色選舉的規則,競選失敗方的所有成員設備重啟後均以Slave的角色加入獲勝方,最終合並為一個IRF

 

在角色選舉完成後,IRF形成:

l   盒式設備虛擬化形成的IRF相當於一台框式分布式設備,Master相當於IRF的主用主控板,Slave設備相當於備用主控板(同時擔任接口板的角色),如 5所示。

圖 5 盒式設備虛擬化效果圖

 

l   框式分布式設備虛擬化形成的IRF也相當於一台框式分布式設備,隻是該虛擬的框式分布式設備擁有更多的備用主控板和接口板。Master的主用主控板相當於IRF的主用主控板,Master的備用主控板以及Slave的主用、備用主控板均相當於IRF的備用主控板(同時擔任接口板的角色),如 6所示。

圖 6 框式分布式設備虛擬化效果圖

 

IRF的管理與維護

角色選舉完成之後,IRF形成,所有的成員設備組成一台虛擬設備存在於網絡中,所有成員設備上的資源歸該虛擬設備擁有並由Master統一管理。

1. 成員編號

在運行過程中,IRF使用成員編號(Member ID)來標誌和管理成員設備。在IRF中必須保證所有設備成員編號的唯一性。

如果建立IRF時成員設備的編號不唯一(即存在編號相同的成員設備),則不能建立IRF;如果新設備加入IRF,但是該設備與已有成員設備的編號衝突,則該設備不能加入IRF。請在建立IRF前,統一規劃各成員設備的編號,並逐一進行手工配置,以保證各設備成員編號的唯一性。

2. IRF拓撲維護

如果某成員設備A down或者IRF鏈路down,其鄰居設備會立即將“成員設備A離開”的信息廣播通知給IRF中的其它設備。獲取到離開消息的成員設備會根據本地維護的IRF拓撲信息表來判斷離開的是Master還是Slave,如果離開的是Master,則觸發新的角色選舉,再更新本地的IRF拓撲;如果離開的是Slave,則直接更新本地的IRF拓撲,以保證IRF拓撲能迅速收斂。

3. IRF衝突檢測(MAD功能)

IRF鏈路故障會導致一個IRF變成兩個新的IRF。這兩個IRF擁有相同的IP地址等三層配置,會引起地址衝突,導致故障在網絡中擴大。為了提高係統的可用性,當IRF分裂時我們就需要一種機製,能夠檢測出網絡中同時存在多個IRF,並進行相應的處理盡量降低IRF分裂對業務的影響。MADMulti-Active Detection,多Active檢測)就是這樣一種檢測和處理機製。它主要提供以下功能:

l   分裂檢測:通過LACPLink Aggregation Control Protocol,鏈路聚合控製協議)、BFDBidirectional Forwarding Detection,雙向轉發檢測)或者免費ARPGratuitous Address Resolution Protocol)來檢測網絡中是否存在多個IRF

l   衝突處理:當檢測到網絡中存在多個IRF時,讓Master成員編號最小的IRF繼續正常工作(維持Active狀態),其它IRF會遷移到Recovery狀態(表示IRF處於禁用狀態),並關閉Recovery狀態IRF中所有成員設備上除保留端口以外的其它所有物理端口(通常為業務接口),以保證該IRF不能再轉發業務報文;

l   MAD故障恢複:IRF通過日誌提示用戶多Active衝突。此時設備會嚐試自動修複IRF鏈路,如果修複失敗的話,需要用戶手工修複。IRF鏈路修複後,分裂的IRF會重新合並,Recovery狀態IRF會自動恢複到Active狀態,被關閉的物理端口將自動恢複轉發能力。異常情況下(比如Active狀態的IRF斷電或者故障等),可以通過命令行啟用Recovery狀態的IRFRecovery狀態的IRF會恢複到Active狀態,被關閉的物理端口也會恢複轉發能力。

 

附件下載

聯係我們