通過電源管理和工作負載整合,大幅提升電信業務處理性能
對于嵌入式開發者來說,如何在低功耗和高性能之間取得平衡,是一項艱巨而持久的工作。而電源管理和工作負載整合兩種技術的誕生,正是為了幫助供應商解決這些困難與挑戰。
通過基于策略性的電源管理和動態遷移來降低能耗
根據國際能源機構(IEA)較新的報告數據來看,能源消耗正在穩步上升并且在未來的一段時間仍會持續增長。該報告還預估,到2015年,全球的能源消耗每年將以2.5%的速度增長,其中礦物能源消耗占據了主導地位。增長的部分主要來自于發展中國家生活方式的改變,而世界第一產業將持續為全球能源消耗的日益減少做出貢獻。
業界領先的電信運營商年報顯示,電信業的能源消耗持續增加,并出現在一些國家能源消耗大戶的名單上。因為這些運營商持續的引入復雜的信息和通信技術,導致外圍硬件設備的需求數量劇增,因此對能源的需求也隨之增加,進而導致二氧化碳排放量的增加,同時能耗的成本也隨之上升。但是運營商長期的財務壓力,勢必要求在降低能耗支出,同時滿足企業的社會責任需求和/或符合相應的法律法規。但是數據處理以及傳輸速率的提高,需要更多的通信設備來支持,這反過來又擴大了電信業的總體功耗。
為了獲得可持續的發展,電信運營商及設備提供商開始逐漸意識到并加強電源管理技術的投入,通過重點開發能源效率計劃,實現節能減排。部署于網絡系統中的AdvancedTCA®(ATCA)機箱,在其整個生命周期中,大部分二氧化碳排放主要來自于機箱本身的性能需要以及冷卻散熱的需求。功耗則主要來自于運營階段,在此階段的二氧化碳排放量占整個產品生命周期總排放量的80%左右。運營階段中的三個層次(輔助設備、網絡設備和能量轉換)將消耗能量,同時也是可以管理的部分。通過對相關技術的掌握,我們可以實現能耗的管理。
圖1. 僅有36%的能量消耗來自于網絡設備,如服務器、存儲設備以及網絡裝置,其中大部分的能量直接轉化為熱能,大約只有2.4%的能量是有效輸出。如今,供應商所提供的基于ATCA架構的網絡設備都采用了提升能源效率的解決方案,可以大幅節約輔助設備及電源轉換過程中的能耗。
合理的設計對于散熱管理非常重要,通過降低CPU的利用率,電源輸出隨之減少,進而降低機房內的散熱需求。較終既降低了二氧化碳的排放,又減少了因散熱產生的能源消耗成本。
電源管理的理念和技術
對于設備本身而言,也有一些設計理念可以用來幫助減少能耗。其中較為大家熟知的就是處理器級動態電源管理技術,這使得設備或系統可以被設置成不同的工作模式,如:性能/按需/節能/緊急。通過這項技術,可以對處理器進行動態電壓調節和動態頻率調節,從而進行有效的電源管理。通過動態電壓調節和動態頻率調節,處理器的核心電壓、時鐘頻率或者兩者都可以減小以降低能耗,同時還能滿足系統的性能所需。功耗限制功能可以讓系統或組件保持其能耗使用峰值在設定的數值范圍內(此數值通常根據實際的服務模式下的策略而定),如CPU使用率的原始數據、并發會話數量等等。
ATCA機箱級的電源管理策略包含了用于負載整合的虛擬化動態遷移,此策略可以降低能耗和相關的成本/費用。服務器管理員可以借助動態遷移將一個正在運行的虛擬設備(VM)或應用在兩個不同的物理設備間遷移,且不會斷開與客戶端的鏈接或應用。動態遷移較典型的一個應用就是云計算中的資源管理。電信運營商擁有的成千上萬個虛擬設備(VM)都運行在其數據中心,為了節約能源和成本、負載均衡,這些電信運營商可以利用動態遷移對虛擬設備進行轉移,而無需中斷運行在這些虛擬設備中的客戶應用程序。
實時遷移的配置策略可以基于能耗感知的遷移模式和/或負載調度的模式而定,這取決于首要目的是節能還是優質的服務品質。實時遷移節能的關鍵是有效地對服務進行打包并提供給更少的物理服務器,物理服務器數量的減少意味著對電力能源的需求就會減少,所產生的熱量也隨之減少,從而實現節能的較終目的。
雖然實時虛擬設備遷移具有諸多益處,如資源(CPU,內存等)的分配和能耗感知的整合,但是虛擬設備的遷移本身也需要消耗額外的能量。曾經有一篇關于虛擬設備實時遷移的性能和能量模式的文章,發表在第20屆高性能分布式計算國際研討會會議論文集上,該篇文章講述了一個測試方法,用來測試實時遷移的功耗。結果顯示,當部署了能耗感知以及服務器整合模型后,實時遷移所消耗的能量大幅減少。這種模式引導的決策,大幅減少了72.9%的遷移成本,并且節能73.6%。
配置和控制管理策略
以電信行業為例,現今的ATCA機箱通常包括一組高品質的電源模塊以及智能風扇系統,可以用來控制溫度輸出和功耗。我們使用一個典型的ATCA機箱來做相關的測試,通過自動調整策略(根據周圍的溫度來決定風扇的轉速),風扇(整個機箱的1/8)的功耗可以減少40%。
對于機箱剩余的7/8部分,可以通過嵌入式軟件設置每個刀片上的CPU、內存以及其他設備的頻率和工作模式,從而實現動態電源管理和/或功耗限定。通過智能固件和軟件層面的控制部署電源管理策略,可以大幅減少能耗。
從系統管理的角度來看,當系統的工作負載運行在滿負荷水平之下時,就可以按既定策略實現動態電源管理。同時在峰值期間也可以使用動態電源管理以減少功耗。然而,當功耗(能量)節約模式啟用時,處理器頻率將降低,從而影響工作負載的性能和吞吐量。
功耗限定功能可以通過顯示器或制動器的內部或外部處理實現。制動器可以提升處理器的電壓或提升處理器/內存的頻率。制動器也可以“抑制”處理器,即通過注入死循環來延遲對指令的處理。當功耗限定達到時以及限定技術啟用時,工作負載的性能可能會受到影響。
嵌入式電源管理軟件
電源管理軟件的拓撲結構是由多個系統守護進程的組件構成,其中每個組件都會管理一個刀片,和一個客戶端組件。
圖2:嵌入式電源管理的基本組件
客戶端代表電源管理系統搜集與電源有關的數據。系統守護進程是加載在每一個刀片上的應用,扮演者電源管理模塊的角色。它提供了CPU、內存、硬盤、網絡和虛擬化的工作方法以及功耗限定等功能,在滿足性能需求的前提下盡量降低功耗。實際的管理端可以運行在臺式機或者筆記本上,通過整合并顯示輸出機箱、板卡和傳感器(如溫度)等實際功耗的信息。
圖3:功耗限定功能實例
主動電源管理
通過策略的配置,將ATCA刀片上CPU的工作模式切換至節能或主動電源管理模式后,每個刀片的功耗相比持續運行在性能模式下減少15%(參見圖4和圖5)。每片板卡在加載服務的情況下可以節約0.4KW的功耗(參見圖5)。如果一個14槽的ATCA機框中使用了10個刀片,那每天節約的功耗大約4KW。
圖4&5:CPU在三種獨立模式下的功耗比較
動態遷移
減少功耗的另一個非常有效的方法就是只使用必要的設備來處理相關事件。利用Erlang概率分布算法(圖表6)可以有效檢測出使用率較低的時段。
圖6:Erlang概率分布算法在電信網絡流量監測中的實例
通過上面的圖表我們可以了解到,1點至7點期間的CPU使用率較低,然而,即使運行在省電模式下,每片板卡仍然在消耗電能。在這種情況下,每片板卡在主動電源管理的策略下會消耗90W的功耗,峰值性能時會上升至140W。解決的辦法就是利用實時遷移策略,用較少的CPU刀片在處理這些工作負載,同時將節能模式下的刀片切換到睡眠模式,這樣相比主動電源管理的模式可以節約超過25%的功耗。
通過工作負載整合提升系統性能
在工作負載和I/O處理方面,目前的市場和技術發展趨勢比較傾向采用將傳統的網絡架構整合到一個通用平臺或模塊化的組件上來,以支持多網絡設備和提供不同的服務功能,如應用處理、控制處理、包處理和信號處理功能等。處理器架構以及新的軟件開發工具的功能提升,讓開發人員可以很容易的將工作負載整合到統一的刀片架構中,這些負載包含了應用、控制以及包處理等。通過軟硬件的整合,可以大幅度提升性能,并使得刀片式服務器架構在包處理解決方案中的應用大幅增加。
為了說明工作負載整合的演變,我們設計了一系列的測試方法。這些測試方法是在單一平臺中,通過將CPU制造商提供的DPDK整合到ATCA處理器刀片上,以此驗證處理器刀片提供的性能以及整合的IP轉發服務。比較在沒有使用Intel® DPDK做任何優化時,采用原生 Linux(Native Linux) IP轉發時的第三層轉發性能。然后,我們再分析采用Intel® DPDK技術之后所獲得的IP轉發性能提升的原因。
數據平面開發套件
DPDK(Data Plane Development Kit,數據平面開發套件)是一個專為x86架構處理器提供的輕量級運行環境。它提供了低功耗和Run-to-Completion(RTC,運行到完成)模式,以此較大限度的提升數據包的處理性能。而且DPDK還包含了優化的和高效的函數庫,為用戶提供豐富的選擇,例如我們熟知的環境抽象層(EAL,Environment Abstraction Layer),它負責控制低級資源并提供優化的輪詢模式驅動(PMD,Poll Mode Driver),以及更高級別應用的完整API接口,圖7為軟件層級結構圖。
圖7: Linux應用環境下的EAL和GLIBC
測試拓撲結構
為了測量ATCA處理器刀片在第三層處理和轉發IP包的速度,我們使用圖8中所示的環境進行測試。
圖8:IP轉發測試環境
我們的測試使用了ATCA處理器刀片的2個10GbE外部接口和兩個10GbE Fabric接口(總計40G),通過比較使用和未使用DPDK的結果,我們可以得出結論:在相同的硬件平臺下,使用DPDK后的Linux僅用兩個CPU線程進行IP轉發的性能,與原生 Linux(Native Linux)使用全部的CPU線程進行IP轉發的性能相比,前者是后者的10倍。使用DPDK的平臺,3層小數據包的轉發線速可以達到>70%。DPDK中優化過的軟件堆?梢詫崿F10倍性能的提升。如果在一個基于IA架構的刀片的控制層和數據層配備DPDK,就可以減少一個40G的NPU刀片。通常一個40G的GPU刀片的功耗為180W,因此通過工作負載整合可以節省56%的能耗。
從圖9可以看出,搭配DPDK后的處理器刀片的IPv4轉發性能,可以讓客戶以更好的性價比成本,將包處理應用從基于硬件的網絡處理器移植到基于x86的計算平臺,同時使用同一個平臺來部署不同的服務,如程序處理、控制處理和包處理服務。更多關于我們的測試過程和結果,請登錄凌華科技網站www.adlinktech.com查詢凌華科技的技術白皮書:采用Intel® DPDK技術的凌華科技aTCA-6200刀片式服務器完美實現包轉發服務性能的提升。
圖9:采用4個10GbE的IP轉發性能比較
結論
目前有很多途徑可以優化多板卡/多處理器系統的電源使用及效率。我們已經看到了使用嵌入式電源管理、整合嵌入式電源管理的動態遷移以及優化吞吐量的工作負載整合等方法的可能性。由于每個系統的配置和對工作負載的需求都不盡相同,因此沒有一個絕對的解決辦法。對于每一個方案,都需要仔細選擇適合的技術和策略,以滿足預期的吞吐量和功耗。
在未來,隨著每個系統的功耗密度(瓦/立方英寸)的持續增加,必然對散熱和運營的花費造成一定的影響,因此電源管理對于電信運營商而言將仍舊是一個需要重視的問題。
關于凌華
凌華科技致力于量測、自動化及計算機通訊科技之改進及創新,提供解決方案給全球網絡電信、智能交通及電子制造客戶。憑著對專業技術的執著與實踐客戶承諾的自我要求,領先業界推出多項創新性產品,獲ISO-9001、ISO-14001、ISO-13485、臺灣精品、TL9000等多項認證。凌華科技為Intel®智能系統聯盟(Intel® Intelligent Systems Alliance)會員,PICMG協會和PC/104協會可參與制定規格的會員,PXI Systems Alliance協會董事會及較高等級會員,以及AXIe聯盟戰略會員,VMEbus國際貿易協會(VITA)成員。目前在美國、新加坡、中國、日本、德國設有子公司,在印度、韓國、法國設有辦事處,為當地客戶提供快捷服務和實時支持。網址:http://www.adlinktech.com/cn。
相關閱讀:
- ...· Efinix® 全力驅動AI邊緣計算,成功推出Trion™ T20 FPGA樣品, 同時將產品擴展到二十萬邏輯單元的T200 FPGA
- ...· 英飛凌亮相進博會,引領智慧新生活
- ...· 三電產品開發及測試研討會北汽新能源專場成功舉行
- ...· Manz亞智科技跨入半導體領域 為面板級扇出型封裝提供化學濕制程、涂布及激光應用等生產設備解決方案
- ...· 中電瑞華BITRODE動力電池測試系統順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測試系統中標北京新能源汽車股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負載系統成功交付中電熊貓
- ...· 中電瑞華國際在電動汽車及關鍵部件測評研討會上演繹先進測評技術