目 錄
QoS(Quality of Service)即服務質量。對於網絡業務,服務質量包括傳輸的帶寬、傳送的時延、數據的丟包率等。在網絡中可以通過保證傳輸的帶寬、降低傳送的時延、降低數據的丟包率以及時延抖動等措施來提高服務質量。
網絡資源總是有限的,隻要存在搶奪網絡資源的情況,就會出現服務質量的要求。服務質量是相對網絡業務而言的,在保證某類業務的服務質量的同時,可能就是在損害其它業務的服務質量。例如,在網絡總帶寬固定的情況下,如果某類業務占用的帶寬越多,那麼其他業務能使用的帶寬就越少,可能會影響其他業務的使用。因此,網絡管理者需要根據各種業務的特點來對網絡資源進行合理的規劃和分配,從而使網絡資源得到高效利用。
下麵從QoS服務模型出發,對目前使用最多、最成熟的一些QoS技術逐一進行描述。在特定的環境下合理地使用這些技術,可以有效地提高服務質量。
通常QoS提供以下三種服務模型:
l Best-Effort service(盡力而為服務模型)
l Integrated service(綜合服務模型,簡稱Int-Serv)
l Differentiated service(區分服務模型,簡稱Diff-Serv)
Best-Effort是一個單一的服務模型,也是最簡單的服務模型。對Best-Effort服務模型,網絡盡最大的可能性來發送報文。但對時延、可靠性等性能不提供任何保證。
Best-Effort服務模型是網絡的缺省服務模型,通過FIFO隊列來實現。它適用於絕大多數網絡應用,如FTP、E-Mail等。
Int-Serv是一個綜合服務模型,它可以滿足多種QoS需求。該模型使用資源預留協議(RSVP),RSVP運行在從源端到目的端的每個設備上,可以監視每個流,以防止其消耗資源過多。這種體係能夠明確區分並保證每一個業務流的服務質量,為網絡提供最細粒度化的服務質量區分。
但是,Inter-Serv模型對設備的要求很高,當網絡中的數據流數量很大時,設備的存儲和處理能力會遇到很大的壓力。Inter-Serv模型可擴展性很差,難以在Internet核心網絡實施。
Diff-Serv是一個多服務模型,它可以滿足不同的QoS需求。與Int-Serv不同,它不需要通知網絡為每個業務預留資源。區分服務實現簡單,擴展性較好。
本文提到的技術都是基於Diff-Serv服務模型。
QoS技術包括流分類、流量監管、流量整形、接口限速、擁塞管理、擁塞避免等。下麵對常用的技術簡單進行一下介紹。
圖 1 常用QoS技術在網絡中的位置
如上圖所示,流分類、流量監管、流量整形、擁塞管理和擁塞避免主要完成如下功能:
l 流分類:采用一定的規則識別符合某類特征的報文,它是對網絡業務進行區分服務的前提和基礎。
l 流量監管:對進入或流出設備的特定流量進行監管。當流量超出設定值時,可以采取限製或懲罰措施,以保護網絡資源不受損害。可以作用在接口入方向和出方向。
l 流量整形:一種主動調整流的輸出速率的流量控製措施,用來使流量適配下遊設備可供給的網絡資源,避免不必要的報文丟棄,通常作用在接口出方向。
l 擁塞管理:就是當擁塞發生時如何製定一個資源的調度策略,以決定報文轉發的處理次序,通常作用在接口出方向。
l 擁塞避免:監督網絡資源的使用情況,當發現擁塞有加劇的趨勢時采取主動丟棄報文的策略,通過調整隊列長度來解除網絡的過載,通常作用在接口出方向。
圖 2 各QoS技術在同一網絡設備中的處理順序
上圖簡要描述了各種QoS技術在網絡設備中的處理順序。
(1) 首先通過流分類對各種業務進行識別和區分,它是後續各種動作的基礎;
(2) 通過各種動作對特性的業務進行處理。這些動作需要和流分類關聯起來才有意義。具體采取何種動作,與所處的階段以及網絡當前的負載狀況有關。例如,當報文進入網絡時進行流量監管;流出節點之前進行流量整形;擁塞時對隊列進行擁塞管理;擁塞加劇時采取擁塞避免措施等。
QoS的配置方式分為QoS策略配置方式和非QoS策略配置方式兩種。
有些QoS功能隻能使用其中一種方式來配置,有些使用兩種方式都可以進行配置。在實際應用中,兩種配置方式也可以結合起來使用。
非QoS策略配置方式是指不通過QoS策略來進行配置。例如,端口限速功能可以通過直接在接口上配置來實現。
QoS策略配置方式是指通過配置QoS策略來實現QoS功能。
QoS策略包含了三個要素:類、流行為、策略。用戶可以通過QoS策略將指定的類和流行為綁定起來,靈活地進行QoS配置。
(1) 類
類的要素包括:類的名稱和類的規則。
用戶可以通過命令定義一係列的規則來對報文進行分類。同時用戶可以指定規則之間的關係:and或者or。
l and:報文隻有匹配了所有的規則,設備才認為報文屬於這個類。
l or:報文隻要匹配了類中的任何一個規則,設備就認為報文屬於這個類。
(2) 流行為
流行為用來定義針對報文所做的QoS動作。
流行為的要素包括:流行為的名稱和流行為中定義的動作。
用戶可以通過命令在一個流行為中定義多個動作。
(3) 策略
策略用來將指定的類和流行為綁定起來,對分類後的報文執行流行為中定義的動作。
策略的要素包括:策略名稱、綁定在一起的類和流行為的名稱。
用戶可以在一個策略中定義多個類與流行為的綁定關係。
報文在進入設備以後,設備會根據自身情況和相應規則(primap、remark)分配或修改報文的各種優先級的值,為隊列調度和擁塞控製服務。
優先級映射功能通過報文所攜帶的優先級字段來映射其他優先級字段值,就可以獲得各種用以決定報文調度能力的各種優先級字段,從而可以全麵有效的控製報文的轉發調度能力。
優先級用於標識報文傳輸的優先程度,可以分為兩類:報文攜帶優先級和設備調度優先級。
報文攜帶優先級包括:802.1p優先級、DSCP優先級、IP優先級、EXP優先級等。這些優先級都是根據公認的標準和協議生成,體現了報文自身的優先等級。
設備調度優先級是指報文在設備內轉發時所使用的優先級,隻對當前設備自身有效。設備調度優先級包括以下幾種:
l 本地優先級(LP):設備為報文分配的一種具有本地意義的優先級,每個本地優先級對應一個隊列,本地優先級值越大的報文,進入的隊列優先級越高,從而能夠獲得優先的調度。
l 丟棄優先級(DP):在進行報文丟棄時參考的參數,丟棄優先級值越大的報文越被優先丟棄。
l 用戶優先級(UP):設備對於進入的流量,會自動獲取報文的優先級,這種報文優先級稱為用戶優先級。
設備提供了多張優先級映射表,分別對應相應的優先級映射關係。
通常情況下,可以通過查找缺省優先級映射表來為報文分配相應的優先級。如果缺省優先級映射表無法滿足用戶需求,可以根據實際情況對映射表進行修改。
如果不限製用戶發送的流量,那麼大量用戶不斷突發的數據隻會使網絡更擁擠。為了使有限的網絡資源能夠更好地發揮效用,更好地為更多的用戶服務,必須對用戶的流量加以限製。比如限製每個時間間隔某個流隻能得到承諾分配給它的那部分資源,防止由於過分突發所引發的網絡擁塞。
流量監管、流量整形和接口限速都可以通過對流量規格的監督來限製流量及其資源的使用,它們有一個前提條件,就是要知道流量是否超出了規格,然後才能根據評估結果實施調控。一般采用令牌桶(Token Bucket)對流量的規格進行評估。
令牌桶可以看作是一個存放一定數量令牌的容器。係統按設定的速度向桶中放置令牌,當桶中令牌滿時,多出的令牌溢出,桶中令牌不再增加。
在用令牌桶評估流量規格時,是以令牌桶中的令牌數量是否足夠滿足報文的轉發為依據的。如果桶中存在足夠的令牌可以用來轉發報文,稱流量遵守或符合這個規格,否則稱為不符合或超標。
評估流量時令牌桶的參數包括:
l 平均速率:向桶中放置令牌的速率,即允許的流的平均速度。通常配置為CIR。
l 突發尺寸:令牌桶的容量,即每次突發所允許的最大的流量尺寸。通常配置為CBS,突發尺寸必須大於最大報文長度。
每到達一個報文就進行一次評估。每次評估,如果桶中有足夠的令牌可供使用,則說明流量控製在允許的範圍內,此時要從桶中取走與報文轉發權限相當的令牌數量;否則說明已經耗費太多令牌,流量超標了。
為了評估更複雜的情況,實施更靈活的調控策略,可以配置兩個令牌桶(簡稱C桶和E桶)。例如TP中有四個參數:
l CIR:表示向C桶中投放令牌的速率,即C桶允許傳輸或轉發報文的平均速率;
l CBS:表示C桶的容量,即C桶瞬間能夠通過的承諾突發流量;
l PIR:表示向E桶中投放令牌的速率,即E桶允許傳輸或轉發報文的最大速率;
l EBS:表示E桶的容量,即E桶瞬間能夠通過的超出突發流量。
CBS和EBS是由兩個不同的令牌桶承載的。每次評估時,依據下麵的情況,可以分別實施不同的流控策略:
l 如果C桶有足夠的令牌,報文被標記為green,即綠色報文;
l 如果C桶令牌不足,但E桶有足夠的令牌,報文被標記為yellow,即黃色報文;
l 如果C桶和E桶都沒有足夠的令牌,報文被標記為red,即紅色報文。
流量監管的典型應用是監督進入網絡的某一流量的規格,把它限製在一個合理的範圍之內,或對超出的部分流量進行“懲罰”,以保護網絡資源和運營商的利益。例如可以限製HTTP報文不能占用超過50%的網絡帶寬。如果發現某個連接的流量超標,流量監管可以選擇丟棄報文,或重新設置報文的優先級。
圖 3 TP示意圖
流量監管廣泛的用於監管進入Internet服務提供商ISP的網絡流量。流量監管還包括對所監管流量的流分類服務,並依據不同的評估結果,實施預先設定好的監管動作。這些動作可以是:
l 轉發:比如對評估結果為“符合”的報文繼續正常轉發的處理。
l 丟棄:比如對評估結果為“不符合”的報文進行丟棄。
l 改變優先級並轉發:比如對評估結果為“符合”的報文,將之標記為其它的優先級後再進行轉發。
l 改變優先級並進入下一級監管:比如對評估結果為“符合”的報文,將之標記為其它的優先級後再進入下一級的監管。
l 進入下一級的監管:流量監管可以逐級堆疊,每級關注和監管更具體的目標。
TS(Traffic Shaping,流量整形)是一種主動調整流量輸出速率的措施。一個典型應用是基於下遊網絡結點的TP指標來控製本地流量的輸出。
流量整形與流量監管的主要區別在於,流量整形對流量監管中需要丟棄的報文進行緩存——通常是將它們放入緩衝區或隊列內。當令牌桶有足夠的令牌時,再均勻的向外發送這些被緩存的報文。流量整形與流量監管的另一區別是,整形可能會增加延遲,而監管幾乎不引入額外的延遲。
圖 4 TS示意圖
例如,在下圖所示的應用中,設備Router A向Router B發送報文。Router B要對Router A發送來的報文進行TP監管,對超出規格的流量直接丟棄。
圖 5 流量整形的應用
為了減少報文的無謂丟失,可以在Router A的出口對報文進行流量整形處理。將超出流量整形特性的報文緩存在Router A中。當可以繼續發送下一批報文時,流量整形再從緩衝隊列中取出報文進行發送。這樣,發向Router B的報文將都符合Router B的流量規定。
利用LR(Line Rate,物理接口限速)可以在一個物理接口上限製發送報文(包括緊急報文)的總速率。
LR也是采用令牌桶進行流量控製。如果在設備的某個接口上配置了LR,所有經由該接口發送的報文首先要經過LR的令牌桶進行處理。如果令牌桶中有足夠的令牌,則報文可以發送;否則,報文將進入QoS隊列進行擁塞管理。這樣,就可以對通過該物理接口的報文流量進行控製。
圖 6 LR處理過程示意圖
由於采用了令牌桶控製流量,當令牌桶中存有令牌時,可以允許報文的突發性傳輸;當令牌桶中沒有令牌時,報文必須等到桶中生成了新的令牌後才可以繼續發送。這就限製了報文的流量不能大於令牌生成的速度,達到了限製流量,同時允許突發流量通過的目的。
與流量監管相比,物理接口限速能夠限製在物理接口上通過的所有報文。當用戶隻要求對所有報文限速時,使用物理接口限速比較簡單。
所謂擁塞,是指當前供給資源相對於正常轉發處理需要資源的不足,從而導致服務質量下降的一種現象。
在複雜的Internet分組交換環境下,擁塞極為常見。以下圖中的兩種情況為例:
圖 7 流量擁塞示意圖
l 擁塞增加了報文傳輸的延遲和抖動,可能會引起報文重傳,從而導致更多的擁塞產生。
l 擁塞使網絡的有效吞吐率降低,造成網絡資源的利用率降低。
l 擁塞加劇會耗費大量的網絡資源(特別是存儲資源),不合理的資源分配甚至可能導致係統陷入資源死鎖而崩潰。
在分組交換以及多用戶業務並存的複雜環境下,擁塞又是不可避免的,因此必須采用適當的方法來解決擁塞。
擁塞管理的中心內容就是當擁塞發生時如何製定一個資源的調度策略,以決定報文轉發的處理次序。
對於擁塞管理,一般采用隊列技術,使用一個隊列算法對流量進行分類,之後用某種優先級別算法將這些流量發送出去。每種隊列算法都是用以解決特定的網絡流量問題,並對帶寬資源的分配、延遲、抖動等有著十分重要的影響。
擁塞管理的處理包括隊列的創建、報文的分類、將報文送入不同的隊列、隊列調度等。隊列調度對不同優先級的報文進行分級處理,優先級高的會得到優先發送。
這裏介紹幾種常用的隊列調度機製。
如上圖所示,FIFO按照時間到達的先後決定分組的轉發次序。用戶的業務流在某個設備能夠獲得的資源取決於分組的到達時機及當時的負載情況。Best-Effort報文轉發方式采用的就是FIFO的排隊策略。
如果設備的每個端口隻有一個基於FIFO的輸入或輸出隊列,那麼惡性的應用可能會占用所有的網絡資源,嚴重影響關鍵業務數據的傳送。
每個隊列內部報文的發送(次序)關係缺省是FIFO。
PQ隊列是針對關鍵業務應用設計的。關鍵業務有一個重要的特點,即在擁塞發生時要求優先獲得服務以減小響應的延遲。PQ可以根據網絡協議(比如IP,IPX)、數據流入接口、報文長短、源地址/目的地址等靈活地指定優先次序。優先隊列將報文分成4類,分別為高優先隊列(top)、中優先隊列(middle)、正常優先隊列(normal)和低優先隊列(bottom),它們的優先級依次降低。缺省情況下,數據流進入normal隊列。每個隊列內部又遵循FIFO原則。
在隊列調度時,PQ嚴格按照優先級從高到低的次序,優先發送較高優先級隊列中的分組,當較高優先級隊列為空時,再發送較低優先級隊列中的分組。這樣,將關鍵業務的分組放入較高優先級的隊列,將非關鍵業務的分組放入較低優先級的隊列,可以保證關鍵業務的分組被優先傳送,非關鍵業務的分組在處理關鍵業務數據的空閑間隙被傳送。
PQ的缺點是:擁塞發生時,如果較高優先級隊列中長時間有分組存在,那麼低優先級隊列中的報文將一直得不到服務。
圖 10 定製隊列示意圖
CQ通常有17個隊列,0~16。0隊列為保留的係統隊列,1到16號隊列是用戶隊列,如上圖所示。用戶可以配置流分類的規則,指定16個用戶隊列占用接口或PVC帶寬的比例關係。
在隊列調度時,係統隊列中的分組被優先發送。直到係統隊列為空,再采用輪詢的方式按照預先配置的帶寬比例依次從1到16號用戶隊列中取出一定數量的分組發送出去。這樣,就可以使不同業務的分組獲得不同的帶寬,既可以保證關鍵業務能獲得較多的帶寬,又不至於使非關鍵業務得不到帶寬。缺省情況下,數據流進入1號隊列。
定製隊列的另一個優點是:可根據業務的繁忙程度分配帶寬,適用於對帶寬有特殊需求的應用。雖然16個用戶隊列的調度是輪詢進行的,但對每個隊列不是固定地分配服務時間片——如果某個隊列為空,那麼馬上換到下一個隊列調度。因此,當沒有某些類別的報文時,CQ調度機製能自動增加現存類別的報文可占的帶寬。
在介紹加權公平隊列前,先要理解公平隊列FQ(Fair Queuing)。FQ是為了公平地分享網絡資源,盡可能使所有流的延遲和抖動達到較優而推出的。它照顧了各方麵的利益,主要表現在:
l 不同的隊列獲得公平的調度機會,從總體上均衡各個流的延遲。
l 短報文和長報文獲得公平的調度:如果不同隊列間同時存在多個長報文和短報文等待發送,應當顧及短報文的利益,讓短報文優先獲得調度,從而在總體上減少各個流的報文間的抖動。
與FQ相比,WFQ在計算報文調度次序時增加了優先權方麵的考慮。從統計上,WFQ使高優先權的報文獲得優先調度的機會多於低優先權的報文。WFQ能夠按流的“會話”信息(協議類型、源和目的TCP或UDP端口號、源和目的IP地址、ToS域中的優先級位等)自動進行流分類,並且盡可能多地提供隊列,以將每個流均勻地放入不同隊列中,從而在總體上均衡各個流的延遲。在出隊的時候,WFQ按流的優先級來分配每個流應占有出口的帶寬。優先級的數值越小,所得的帶寬越少。優先級的數值越大,所得的帶寬越多。
例如:接口中當前共有5個流,它們的優先級分別為0、1、2、3、4,則帶寬總配額為所有(流的優先級+1)的和,即1+2+3+4+5=15。
每個流所占帶寬比例為:(自己的優先級數+1)/(所有(流的優先級+1)的和)。即每個流可得的帶寬分別為:1/15,2/15,3/15,4/15,5/15。
由於WFQ在擁塞發生時能均衡各個流的延遲和抖動,所以WFQ在一些特殊場合得到了有效的應用。比如在使用資源預留協議RSVP(Resource Reservation Protocol)的保證型業務中,通常就是采用WFQ作為調度策略;在流量整形中,也采用WFQ調度緩存的報文。
圖 12 基於類的隊列示意圖
CBQ是對WFQ功能的擴展,為用戶提供了定義類的支持。在網絡擁塞時,CBQ根據用戶定義的類規則對報文進行匹配,並使其進入相應的隊列,在入隊列之前必須進行擁塞避免機製和帶寬限製的檢查。在報文出隊列時,加權公平調度每個類對應的隊列中的報文。
CBQ包括以下隊列:
l 緊急隊列:CBQ提供一個緊急隊列,緊急報文入該隊列,該隊列采用FIFO調度,沒有帶寬限製。
l LLQ(Low Latency Queuing,低延遲隊列):即EF隊列。如果CBQ加權公平對待所有類的隊列,實時業務報文(包括語音與視頻業務,對延遲比較敏感)就可能得不到及時發送。為此引入一個EF隊列,為實時業務報文提供嚴格優先發送服務。LLQ將嚴格優先隊列機製與CBQ結合起來使用,用戶在定義類時可以指定其享受嚴格優先服務,這樣的類稱作優先類。所有優先類的報文將進入同一個優先隊列,在入隊列之前需對各類報文進行帶寬限製的檢查。報文出隊列時,將首先發送優先隊列中的報文,直到發送完後才發送其他類對應的隊列的報文。為了不讓其他隊列中的報文延遲時間過長,在使用LLQ時將會為每個優先類指定可用最大帶寬,該帶寬值用於擁塞發生時監管流量。如果擁塞未發生,優先類允許使用超過分配的帶寬。如果擁塞發生,優先類超過分配帶寬的數據包將被丟棄。
l BQ(Bandwidth Queuing,帶寬隊列):即AF隊列。為AF業務提供嚴格、精確的帶寬保證,並且保證各類AF業務之間按一定的比例關係進行隊列調度。最多支持64個AF隊列。
l 缺省隊列:一個WFQ隊列,用來支撐BE業務,使用接口剩餘帶寬進行發送。
係統在為報文匹配規則時,規則如下:
l 先匹配優先類,然後再匹配其他類;
l 對多個優先類,按照配置順序逐一匹配;
l 對其他類,也是按照配置順序逐一匹配;
l 對類中多個規則,按照配置順序逐一匹配。
RTP優先隊列是一種保證實時業務(包括語音與視頻業務)服務質量的簡單的隊列技術。其原理就是將承載語音或視頻的RTP報文送入高優先級隊列,使其得到優先發送,保證時延和抖動降低為較低限度,從而保證了語音或視頻這種對時延敏感業務的服務質量。
圖 13 RTP隊列示意圖
如上圖所示,RTP優先隊列將RTP報文送入一個具有較高優先級的隊列。RTP報文是端口號在一定範圍內為偶數的UDP報文,端口號的範圍可以配置。RTP優先隊列可以同下麵隊列(包括FIFO、PQ、CQ和WFQ)結合使用,而它的優先級是最高的。
所謂擁塞,是指當前供給資源相對於正常轉發處理需要資源的不足,從而導致服務質量下降的一種現象。
在複雜的Internet分組交換環境下,擁塞極為常見。以下圖中的兩種情況為例:
圖 14 流量擁塞示意圖
擁塞有可能會引發一係列的負麵影響:
l 擁塞增加了報文傳輸的延遲和抖動,可能會引起報文重傳,從而導致更多的擁塞產生。
l 擁塞使網絡的有效吞吐率降低,造成網絡資源的利用率降低。
l 擁塞加劇會耗費大量的網絡資源(特別是存儲資源),不合理的資源分配甚至可能導致係統陷入資源死鎖而崩潰。
在分組交換以及多用戶業務並存的複雜環境下,擁塞又是不可避免的,因此必須采用適當的方法來解決擁塞。
擁塞管理的中心內容就是當擁塞發生時如何製定一個資源的調度策略,以決定報文轉發的處理次序。擁塞管理的處理包括隊列的創建、報文的分類、將報文送入不同的隊列、隊列調度等。
對於擁塞管理,一般采用隊列技術,使用一個隊列算法對流量進行分類,之後用某種優先級別算法將這些流量發送出去。每種隊列算法都是用以解決特定的網絡流量問題,並對帶寬資源的分配、延遲、抖動等有著十分重要的影響。
隊列調度對不同優先級的報文進行分級處理,優先級高的會得到優先發送。這裏介紹四種常用的隊列:嚴格優先級SP(Strict-Priority)隊列、加權輪詢WRR(Weighted Round Robin)隊列、加權公平隊列(Weighted Fair Queuing)和基於類的隊列CBQ(Class Based Queuing)。
圖 15 SP隊列示意圖
SP隊列是針對關鍵業務類型應用設計的。關鍵業務有一個重要的特點,即在擁塞發生時要求優先獲得服務以減小響應的延遲。以上圖為例,優先隊列將端口的8個輸出隊列分成8類,依次為7、6、5、4、3、2、1、0隊列,它們的優先級依次降低。
在隊列調度時,SP嚴格按照優先級從高到低的次序優先發送較高優先級隊列中的分組,當較高優先級隊列為空時,再發送較低優先級隊列中的分組。這樣,將關鍵業務的分組放入較高優先級的隊列,將非關鍵業務的分組放入較低優先級的隊列,可以保證關鍵業務的分組被優先傳送,非關鍵業務的分組在處理關鍵業務數據的空閑間隙被傳送。
SP的缺點是:擁塞發生時,如果較高優先級隊列中長時間有分組存在,那麼低優先級隊列中的報文將一直得不到服務。
SP隊列分為:
l 基本SP隊列:基本SP隊列包含多個隊列,分別對應不同的優先級,按優先級遞減的順序進行調度。
l 多模式SP隊列:在基本SP隊列基礎上擴展出不同的調度模式。
多模式SP隊列的模式說明如下:
l SP模式0,基本SP隊列,嚴格按照優先級對隊列進行調度。
l SP模式1,此種模式下,當外部存儲器空間足夠時,按SP隊列調度算法執行;當外部存儲器沒有空間時,即使有更高優先級的隊列等候在那裏,調度算法也可選擇芯片內存中的低優先級報文進行轉發。
l SP模式2,此種模式下,隻要芯片內存中有報文,這些報文就會被選擇輸出;芯片內存中沒有報文時,所有的報文按SP隊列調度算法進行調度。本模式的缺點是會降低外部存儲器總線帶寬。
圖 16 WRR隊列示意圖
WRR隊列在隊列之間進行輪流調度,保證每個隊列都得到一定的服務時間。以端口有8個輸出隊列為例,WRR可為每個隊列配置一個加權值(依次為w7、w6、w5、w4、w3、w2、w1、w0),加權值表示獲取資源的比重。如一個100Mbps的端口,配置它的WRR隊列的加權值為50、50、30、30、10、10、10、10(依次對應w7、w6、w5、w4、w3、w2、w1、w0),這樣可以保證最低優先級隊列至少獲得5Mbps的帶寬,避免了采用SP調度時低優先級隊列中的報文可能長時間得不到服務的缺點。
WRR隊列還有一個優點是,雖然多個隊列的調度是輪詢進行的,但對每個隊列不是固定地分配服務時間片——如果某個隊列為空,那麼馬上換到下一個隊列調度,這樣帶寬資源可以得到充分的利用。
WRR隊列分為:
l 基本WRR隊列:基本WRR隊列包含多個隊列,用戶可以定製各個隊列的權重、百分比或字節計數,WRR按用戶設定的參數進行加權輪詢調度。
l 分組WRR隊列:所有隊列全部采用WRR調度,用戶可以根據需要將輸出隊列劃分為WRR優先級隊列組1和WRR優先級隊列組2。進行隊列調度時,設備首先在優先級隊列組1中進行輪詢調度;優先級隊列組1中沒有報文發送時,設備才在優先級隊列組2中進行輪詢調度。
l 帶最大時延的WRR隊列:帶最大時延的WRR隊列調度算法與基本WRR隊列相比,一個特別之處是,保證在優先級最高的隊列中的報文從進入隊列到離開隊列的最大時間不超過所設定的最大時延。
圖 17 WFQ隊列
WFQ和WRR隊列調度算法類似,在權重算法上都支持byte-count和weight,也支持SP分組,可以相互替換。
兩者差異如下:WRR支持最大時延,可以保證所配置隊列中的報文從進入隊列到離開隊列的最大時間不超過所設定的最大時延;WFQ支持帶寬保證,可以保證端口流量擁塞時能夠獲得的最小隊列帶寬。
CBQ為用戶提供了定義類的支持,為每個用戶定義的類分配一個單獨的FIFO預留隊列,用來緩衝同一類的數據。在網絡擁塞時,CBQ對報文根據用戶定義的類規則進行匹配,並使其進入相應的隊列,在入隊列之前必須進行擁塞避免機製和帶寬限製的檢查。在報文出隊列時,加權公平調度每個類對應的隊列中的報文。
CBQ提供LLQ(Low Latency Queuing,低延遲隊列),為實時業務報文提供嚴格優先發送服務。在使用LLQ時將會為每個優先類指定可用最大帶寬,該帶寬值用於擁塞發生時監管流量。如果擁塞未發生,優先類允許使用超過分配的帶寬。如果擁塞發生,優先類超過分配帶寬的數據包將被丟棄。LLQ還可以指定Burst-size。
CBQ還提供BQ(Bandwidth Queuing,帶寬隊列)調度隊列和加權公平調度隊列。這兩種隊列缺省采用尾丟棄的策略。用戶還可以選擇用加權隨機早期檢測(Weighted Random Early Detection,WRED)的丟棄策略來進行流量限製。
係統在為報文匹配規則時,規則如下:
l 不同類之間按照C-B對的配置順序逐一匹配,先配置先生效。
l 同一個類內的多個規則也是按照配置順序逐一匹配,先配置先生效。
過度的擁塞會對網絡資源造成極大危害,必須采取某種措施加以解除。擁塞避免(Congestion Avoidance)是一種流量控製機製,它通過監視網絡資源(如隊列或內存緩衝區)的使用情況,在擁塞產生或有加劇的趨勢時主動丟棄報文,通過調整網絡的流量來解除網絡過載。
與端到端的流量控製相比,這裏的流量控製具有更廣泛的意義,它影響到設備中更多的業務流的負載。設備在丟棄報文時,需要與源端的流量控製動作(比如TCP流量控製)相配合,調整網絡的流量到一個合理的負載狀態。丟包策略和源端流控機製有效的組合,可以使網絡的吞吐量和利用效率最大化,並且使報文丟棄和延遲最小化。
傳統的丟包策略采用尾部丟棄(Tail-Drop)的方法。當隊列的長度達到最大值後,所有新到來的報文都將被丟棄。
這種丟棄策略會引發TCP全局同步現象:當隊列同時丟棄多個TCP連接的報文時,將造成多個TCP連接同時進入擁塞避免和慢啟動狀態以降低並調整流量,而後又會在某個時間同時出現流量高峰。如此反複,使網絡流量忽大忽小,網絡不停震蕩。
為避免TCP全局同步現象,可使用RED(Random Early Detection,隨機早期檢測)或WRED(Weighted Random Early Detection,加權隨機早期檢測)。
RED和WRED通過隨機丟棄報文避免了TCP的全局同步現象,使得當某個TCP連接的報文被丟棄、開始減速發送的時候,其他的TCP連接仍然有較高的發送速度。這樣,無論什麼時候,總有TCP連接在進行較快的發送,提高了線路帶寬的利用率。
在RED類算法中,為每個隊列都設定上限和下限,對隊列中的報文進行如下處理:
l 當隊列的長度小於下限時,不丟棄報文;
l 當隊列的長度超過上限時,丟棄所有到來的報文;
l 當隊列的長度在上限和下限之間時,開始隨機丟棄到來的報文。隊列越長,丟棄概率越高,但有一個最大丟棄概率。
與RED不同,WRED生成的隨機數是基於優先權的,它引入IP優先權區別丟棄策略,考慮了高優先權報文的利益,使其被丟棄的概率相對較小。
直接采用隊列的長度和上限、下限比較並進行丟棄,將會對突發性的數據流造成不公正的待遇,不利於數據流的傳輸。WRED采用平均隊列和設置的隊列上限、下限比較來確定丟棄的概率。
隊列平均長度既反映了隊列的變化趨勢,又對隊列長度的突發變化不敏感,避免了對突發性數據流的不公正待遇。計算隊列平均長度的公式為:平均隊列長度=(以前的平均隊列長度×(1-1/(2的n次方)))+(當前隊列長度×(1/(2的n次方)))。其中n可以通過命令qos wred weighting-constant進行配置。
當隊列機製采用WFQ時,可以為不同優先級的報文設定計算隊列平均長度時的指數、上限、下限、丟棄概率,從而對不同優先級的報文提供不同的丟棄特性。
當隊列機製采用FIFO、PQ、CQ時,可以為每個隊列設定計算隊列平均長度時的指數、上限、下限、丟棄概率,為不同類別的報文提供不同的丟棄特性。
WRED和隊列機製的關係如下圖所示。
圖 18 WRED和隊列機製關係示意圖
當WRED和WFQ配合使用時,可以實現基於流的WRED。在進行分類的時候,不同的流有自己的隊列,對於流量小的流,由於其隊列長度總是比較小,所以丟棄的概率將比較小。而流量大的流將會有較大的隊列長度,從而丟棄較多的報文,保護了流量較小的流的利益。
流量過濾就是將符合流分類的流配置流量過濾動作。
例如,可以根據網絡的實際情況禁止從某個源IP地址發送的報文通過。
重標記是將報文的優先級或者標誌位進行設置,重新定義流量的優先級等。例如,對於IP報文來說,所謂重標記就是對IP報文中的IP優先級或DSCP值進行重新設置,改變IP報文在網絡傳輸中狀態。
重標記動作的配置,可以通過與類關聯,將原來報文的優先級或標誌位重新進行標記。
流量重定向簡介流量重定向就是將符合流分類的流重定向到其他地方進行處理。
目前支持的流量重定向包括以下幾種:
l 重定向到均衡組:均衡組可以像以太網接口一樣被其他業務使用。
l 重定向到CPU:對於需要CPU處理的報文,可以通過配置上送給CPU。
l 重定向到接口:對於收到需要由某個接口處理的報文時,可以通過配置重定向到此接口。
l 重定向到下一跳:對於收到需要由某個接口處理的報文時,可以通過配置重定向到此接口。
l 重定向到業務環回組:當某塊業務板收到需要由其它業務板進行處理的報文時,該業務板將此報文發送到能處理該業務的單板上完成報文的處理和轉發,將多個業務環回端口綁定在一起就構成業務環回組,能夠增加板間業務重定向的吞吐能力。
l 重定向到指定的VPN實例:對於需要某個VPN處理的報文,可以通過配置重定向到此VPN實例。
全局CAR是在全局創建的一種策略,所有應用該策略的數據流將共同接受全局CAR的監管。
目前全局CAR支持聚合CAR和分層CAR兩種。
聚合CAR是指能夠對多個業務流使用同一個CAR進行流量監管,即如果多個端口應用同一聚合CAR,則這多個端口的流量之和必須在此聚合CAR設定的流量監管範圍之內。
分層CAR是一種更靈活的流量監管策略,用戶可以在為每個流單獨配置CAR動作(或聚合CAR)的基礎上,再通過分層CAR對多個流的流量總和進行限製。
分層CAR與普通CAR(或聚合CAR)的結合應用有兩種模式:
l and:在該模式下,對於多條數據流應用同一個分層CAR,必須每條流滿足各自的普通CAR(或聚合CAR)配置,同時各流量之和又滿足分層CAR的配置,流量才能正常通過。and模式適用於嚴格限製流量帶寬的環境,分層CAR的限速配置通常小於各流量自身CAR的限速值之和。例如對於Internet流量,可以使用普通CAR將數據流1和數據流2各自限速為128kbps,再使用分層CAR限製總流量為192kbps。當不存在數據流1時,數據流2可以用達到自身限速上限的速率訪問Internet,如果存在數據流1,則兩個數據流不能超過各自限速且總速率不能超過192kbps。
l or:在該模式下,對於多條數據流應用同一個分層CAR,隻要每條流滿足各自的普通CAR(或聚合CAR)配置或者各流量之和滿足分層CAR配置,流量即可正常通過。or模式適用於保證高優先級業務帶寬的環境,分層CAR的限速值通常等於或大於各流量自身的限速值之和。例如對於視頻流量,使用普通CAR將數據流1和數據流2各自限速128kbps,再使用分層CAR限製總流量為512kbps,則當數據流1的流量不足128kbps時,即使數據流2的流量達到了的384kbps,仍然可以正常通過。
兩種模式可以結合起來使用,達到合理利用帶寬的效果。例如,存在一條視頻流和一條數據流,使用普通CAR將數據流限速1024kbps、視頻流限速2048kbps。連接視頻流接口采用or模式CAR限速3072kbps,因為可能存在多台視頻設備同時上線出現的突發流量,當視頻設備流量速率超出2048kbps時,如果總體流量資源仍有剩餘(即數據流速率在1024kbps以內),這時視頻流可以臨時借用數據流的帶寬;同時,連接數據流接口采用and模式CAR限速3072kbps,確保數據流量不能超出自身限速的1024kbps。
EACL(Enhanced ACL,增強型ACL),即把ACL重定向到業務板。目前設備隻支持自反ACL和BT限流。
自反ACL是增強係統安全性的一種方法,它是一種動態的ACL。所謂動態ACL就是動態生成ACL表項,其基本思想就是根據內網訪問外網的情況生成外網訪問內網的ACL規則,如果內網沒有訪問外網,外網不能主動發起對內網的訪問。
BitTorrent(比特洪流,簡稱BT)是一種用來進行文件下載的共享軟件,其特點是下載的人越多,速度越快。BT下載大大降低了下載服務器的負荷,但也造成網絡下載數據量的劇增,使得網絡帶寬被大量的BT下載流量占據,嚴重影響其它網絡業務,由此產生了對BT流量進行有效控製的需求。
QoS根據BT對等協議的特征(報文包含“BitTorrent protocol”字段)來標記報文,從而達到限製BT報文傳輸的目的。
今天,Internet已經成為企業實施各種業務的主要媒介,各種基於業務的應用也不斷出現。因此,目前隻對報文中的IP報頭進行檢查的簡單機製已經無法適用於當今複雜的網絡,故提出了基於業務的深度應用識別的概念。
DAR(Deeper Application Recognition,深度應用識別)是一個智能的識別分類工具,它可以對報文中第4層到第7層的內容和一些動態協議(如BT、HTTP、FTP、RTP)進行檢查和識別,以區分出各種基於應用的協議,彌補了原先隻能對報文進行簡單分類的不足。
另外,隨著P2P(Peer to Peer,對等網絡)技術的不斷發展和廣泛應用,P2P數據流量在網絡流量中所占的比重越來越大,這不僅對網絡帶寬資源造成了浪費,還對其他業務的正常運行造成了嚴重影響。因此,DAR還需要對P2P流量進行單獨的識別。
通過對報文進行深度的識別和分類,大大加強了用戶對數據流的控製,可以更有效的為關鍵業務數據實施高優先級的策略,進一步保護用戶投資。
流量統計就是通過與類關聯,對符合匹配規則的流進行統計。例如,可以統計從某個源IP地址發送的報文,然後管理員對統計信息進行分析,根據分析情況采取相應的措施。
設備支持兩個統計計數器,可以對入方向和出方向的報文進行統計。
用戶可指定每個計數器所統計的報文類型,報文類型包括:單板所有指定方向報文,或單板以下元素的組合所指定的報文——指定接口、指定VLAN、指定本地優先級、指定丟棄優先級。
用戶可以同時使能兩個統計計數器,分別統計不同的報文類型。
端口隊列統計功能可以對隊列總長度、當前隊列長度、轉發報文總數和轉發各種顏色報文數等信息進行統計。
當不需要統計時,可以關閉此功能。
在下列情況下,Burst功能可以提供更好的報文緩存功能和流量轉發性能:
l 廣播或者組播報文流量密集,瞬間突發大流量的網絡環境中;
l 報文從高速鏈路進入設備,由低速鏈路轉發出去;或者報文從相同速率的多個接口同時進入設備,由一個相同速率的接口轉發出去。
用戶可以通過使能Burst功能,降低設備在上述特定環境中的報文丟包率,提高對報文的處理能力。需要注意的是,使能Burst功能後,設備的QoS性能可能會受到影響,建議用戶根據自己的具體網絡環境進行配置。
在部署大型複雜網絡時,需要執行大量的複雜流分類,而且無法按照團體屬性、ACL、Prefix或AS-Path對報文進行分類。如果網絡結構不穩定,需經常變化網絡結構時,配置修改的工作量非常大甚至難以實施,可以通過部署QPPB減少配置修改的工作量。
應用QPPB技術可以由BGP路由發送者通過設置BGP屬性預先對路由進行分類。這樣在網絡拓撲結構發生變化時隻需要修改路由發送者上的路由策略就可以滿足需求。
QPPB(QoS Policy Propagation Through the Border Gateway Protocol,通過BGP傳播QoS策略)技術是一項通過BGP路由策略部署QoS的技術,通過基於BGP路由的團體列表、AS-Paths list和ACL、Prefix list等屬性進行路由分類,對不同的分類應用不同的QoS策略。
QPPB技術適用於基於目的地址或源地址進行流分類的應用場合,適用於IBGP和EBGP,可以在同一個自治係統內部或者不同的自治係統之間實現。
QPPB技術主要通過BGP傳播的路由屬性設置QoS參數,應用QoS策略,從而實現QoS保障,分為對路由發送者的設置和對路由接收者的設置。
BGP路由發送者在向鄰居發送路由時,先匹配路由策略,為發送的不同路由信息設置不同的BGP路由屬性。
BGP鄰居在接收到路由後,匹配路由策略,QPPB可以根據報文的源IP地址或目的IP地址為接收到的BGP路由設置IP優先級和QoS本地ID。配置QoS策略,根據IP優先級和QoS本地ID對報文進行分類,應用不同的QoS策略,從而實現QoS保證。