Xilinx FPGA的功耗優(yōu)化設(shè)計
對于FPGA來說,設(shè)計人員可以充分利用其可編程能力以及相關(guān)的工具來準確估算功耗,然后再通過優(yōu)化技術(shù)來使FPGA設(shè)計以及相應(yīng)的PCB板在功率方面效率更高。
靜態(tài)和動態(tài)功耗及其變化
在90nm工藝時,電流泄漏問題對ASIC和FPGA都變得相當(dāng)嚴重。在65nm工藝下,這一問題更具挑戰(zhàn)性。為獲得更高的晶體管性能,必須降低閾值電壓,但同時也加大了電流泄漏。Xilinx公司在降低電流泄漏方面做了許多努力,盡管如此,源于泄漏的靜態(tài)功耗在較差和典型工藝條件下的變化仍然有2:1。泄漏功耗受內(nèi)核電壓(VCCINT)的影響很大,大約與其立方成比例,哪怕VCCINT僅上升5%,靜態(tài)功耗就會提高約15%。較后,泄漏電流還與結(jié)(或芯片)溫密切相關(guān)。
FPGA中靜態(tài)功耗的其它來源是工作電路的直流電流,但在很大程度上,這部分電流隨工藝和溫度的變化不大。例如I/O電源(如HSTL、SSTL和LVDS等I/O標準的端接電壓)以及LVDS等電流驅(qū)動型I/O的直流電流。有些FPGA模擬模塊也帶來靜態(tài)功耗,但同樣與工藝和溫度的關(guān)系不大。例如,Xilinx FPGA中用來控制時鐘的數(shù)字時鐘管理器(DCM);Xilinx Virtex-5 FPGA中的鎖相環(huán)(PLL);以及Xilinx FPGA中用于輸入和輸出信息可編程延遲的單元IODELAY。
動態(tài)功耗是指FPGA內(nèi)核或I/O的開關(guān)活動引起的功耗。為計算動態(tài)功耗,必須知道開關(guān)晶體管和連線的數(shù)量、電容和開關(guān)頻率。FPGA中,晶體管在金屬連線間實現(xiàn)邏輯和可編程互連。電容則包括晶體管寄生電容和金屬互連線電容。
動態(tài)功率的公式:PDYNAMIC=nCV2f,其中,n=開關(guān)結(jié)點的數(shù)量,C=電容,V=電壓擺幅,f=開關(guān)頻率。
更緊湊的邏輯封裝(通過內(nèi)部FPGA架構(gòu)改變)可以減少開關(guān)晶體管的數(shù)量。采用更小尺寸的晶體管可以縮短晶體管之間的連線長度,從而降低動態(tài)功率。因此,Virtex-5 FPGA中的65nm晶體管柵極電容更小、互連線長度也更短。兩者結(jié)合起來可將結(jié)點的電容減小約15%至20%,這可進一步降低動態(tài)功率。
電壓對于動態(tài)功率也有影響。從90nm轉(zhuǎn)向65nm工藝,僅僅通過將VCCINT從1.2V降至1V,Virtex-5 FPGA設(shè)計的動態(tài)功率就降低了約30%。再加上結(jié)構(gòu)增強帶來的功率降低,總的動態(tài)功耗比90nm技術(shù)時降低達40%至50%。
(注:動態(tài)功率與VCCINT的平方成正比,但對于FPGA內(nèi)核來說基本上與溫度和工藝無關(guān)。)
利用FPGA設(shè)計技術(shù)降低功耗
Xilinx公司提供了兩款功率分析工具。XPower Estimator (XPE)電子數(shù)據(jù)表工具可在設(shè)計人員使用物理實施工具前使用。在設(shè)計物理實施完成后,則可以采用第二款工具XPower Analyzer來檢查所做的改變對功耗的影響。
降低功耗的一種方法就是為設(shè)計選擇較適用的FPGA,然后利用其可編程能力進一步優(yōu)化設(shè)計的功耗。正確的設(shè)計選擇會同時改善靜態(tài)和動態(tài)功耗。
源于泄漏電流的靜態(tài)功率正比于邏輯資源的數(shù)量,也就是說正比于構(gòu)造特定FPGA所使用的晶體管數(shù)量。因此,如果減少所使用的FPGA資源,采用更小的器件實現(xiàn)設(shè)計,那么就可以降低靜態(tài)功耗。
可以采用多種方法來降低設(shè)計的規(guī)模,較基本的一種技巧就是邏輯功能分時。也就是說,如果兩組電路完成一組線性功能,并且彼此完全相同,那么就可以只用一組電路但將速率提高一倍來完成同樣的功能。這樣需要的邏輯資源就減少了一半。
另一種縮小邏輯規(guī)模的方法是利用Xilinx FPGA的部分重配置功能,當(dāng)兩部分電路不同時工作時,可以在某個時間段將某部分電路重新配置實現(xiàn)另一種電路功能。
同時,還可以將功能移動到不太受限制的資源,例如,將狀態(tài)機轉(zhuǎn)移到BRAM、或者將計數(shù)器轉(zhuǎn)移到DSP48模塊、寄存器轉(zhuǎn)移到移位寄存器邏輯,以及將BRAM轉(zhuǎn)移到查找表RAM(LUTRAM)。同時還可以保證不要讓設(shè)計的時序太緊張,因為那樣會需要更多的邏輯和寄存器。
此外,還應(yīng)當(dāng)充分發(fā)揮FPGA架構(gòu)中集成的硬IP塊(BRAM、DSP、FIFO、Ethernet MAC、PCI Express)的優(yōu)點。
降低靜態(tài)功率的另一個方法是仔細審查設(shè)計,避免冗余的直流消耗源。設(shè)計中經(jīng)常會使用到具有多余或隱藏DCM或PLL的模塊,這種情況可能在模塊設(shè)計后忘記將多余的資源去除,或者在構(gòu)建下一代產(chǎn)品時使用了一些遺留代碼。將DCM或PLL抽象到設(shè)計的頂層,這樣模塊之間就可以共享資源,從而可進一步減小設(shè)計的規(guī)模并降低直流功率。
更好地使用存儲器模塊也可幫助降低FPGA設(shè)計的動態(tài)功耗,從而進一步降低總體功耗。由于動態(tài)功耗是容抗(面積或長度)和頻率的函數(shù),因此應(yīng)當(dāng)檢查設(shè)計中訪問塊存儲器的方式并確定能夠?qū)θ菘购皖l率進行優(yōu)化的區(qū)域。
Xilinx FPGA提供兩種類型的存儲器陣列。18Kbit或36Kbit的BRAM是針對大存儲器模塊而優(yōu)化的。LUTRAM基于FPGA中的查找表,是針對細粒度存儲而優(yōu)化的。Xilinx Virtex-5 FPGA中,LUTRAM的單位是64bit。
在這兩種類型中,BRAM通常功耗要大一些。啟用后的BRAM靜態(tài)功率是其功耗的較大部分,跳變帶來的功耗居于第二位。設(shè)計人員可以采取一些步驟來優(yōu)化BRAM的功耗。例如,可以僅在讀或?qū)懼芷诓艈⒂肂RAM。對于較小的存儲器模塊可以使用LUTRAM來代替BRAM,將BRAM留給較大的存儲器模塊使用。此外,還可以嘗試將BRAM用于多個大型模塊。另一種技術(shù)是合理安排存儲器陣列來減少其占用的延遲面積、使性能較大化并盡量降低其功耗。圖1左側(cè)給出了一個針對速度和面積而優(yōu)化的2K x 36bit存儲陣列。
我們利用四個2K x 9bit模塊并行構(gòu)成這一存儲陣列,并在需要新值時啟用(Enable)所有四個模塊。另一方法是采用四個512 x 36bit模塊來安排2K x 36bit,但利用低兩位地址解碼來選擇訪問哪個512 x 36bit模塊。在后一種情況下,某個時間僅訪問一個存儲器塊,功耗將比第一種方法降低75%。
圖1右側(cè)顯示的是Xilinx公司的塊存儲器生成器(Block Memory Generator),利用它可以生成任意大小的存儲器陣列并可以針對速度或功率對其進行優(yōu)化。圖2則給出了具體應(yīng)用中的Xilinx Power Estimator,比較了在給定的使能速率下N個模塊同時啟動與N/4模塊啟動時的功耗情況。結(jié)果顯示動態(tài)功率降低了75%。
圖1 速度和面積與功率優(yōu)化存儲器陣列(左)
以及Xilinx Block Memory Generator與功率面積選擇(右)
Xilinx工具可幫助選擇適合的存儲器陣列?紤]某個設(shè)計中需要兩組存儲器區(qū)域。一種情況下需要運行在300MHz的16組64 x 32bit存儲器結(jié)構(gòu)(總位數(shù)為32K),另一種情況下需要16組512 x 36bit 存儲器架構(gòu) (總位數(shù)為294K)。
看一下16組64 x 32bit存儲器結(jié)構(gòu)的功率比較,XPE工具顯示出小存儲器陣列較好用LUTRAM來實現(xiàn),這樣比用BRAM節(jié)約85%的功耗(如圖3)。這是因為如果采用BRAM的話,只能用16個18K位的模塊來實現(xiàn)16個極。64 x 32bit)的存儲器,有很多空間被浪費了。而第二種情況16組18K位陣列的功率比較,XPE顯示情況正好相反,應(yīng)當(dāng)采用大一些的存儲器陣列來實現(xiàn)(圖4)。這種情況下,采用BRAM比采用LUTRAM可以節(jié)約28%的功耗,這是因為如果采用LUTRAM就需要啟用更多的小粒度對象并增加更多的互連。
Xilinx FPGA的時鐘門控功能
Xilinx FPGA的時鐘門控功能提供了一些非常有意思的用途。例如,可以利用BUFGMUX時鐘緩沖器將FPGA內(nèi)的某個全局時鐘關(guān)閉,或者動態(tài)選擇較慢的時鐘。還可以使用BUFGCE時鐘緩沖器進行按時鐘周期(cycle-by-cycle)的門控,與ASIC設(shè)計中使用的時鐘門控技術(shù)類似。設(shè)計中可以同時使用這兩種功能。
在某些設(shè)計中,一些模塊并非始終使用,但對于功耗影響卻很大,此時這些方法非常有用。可以時鐘周期為基礎(chǔ)或者按多個時鐘周期的組合開啟或關(guān)閉可能有成千上萬個負載的大型時鐘域。
圖2 XPE功率優(yōu)化陣列結(jié)果
圖3 利用塊RAM 或 LUTRAM實現(xiàn)小存儲器陣列的功率估算
圖4 利用LUTRAM和塊RAM實現(xiàn)大存儲器陣列的功率估算
在電路板一級降低功耗
PCB設(shè)計師、機械工程師和系統(tǒng)架構(gòu)師在電路板一級可以考慮通過幾個方面來降低FPGA的功耗,F(xiàn)PGA的內(nèi)核電壓和結(jié)溫對于功耗的不同方面都有很強的影響。
控制VCCINT內(nèi)核電壓是板級降低功耗的一種方法。源于泄漏的靜態(tài)功耗以及動態(tài)功耗都高度依賴于FPGA的內(nèi)核電壓。因此,減少泄漏的一種方法就是將內(nèi)核電壓設(shè)置在接近額定值(1V)的地方,而不是工作在Virtex-5電壓范圍的高端(1.05V = +5%)。
采用現(xiàn)代開關(guān)穩(wěn)壓器,可以獲得±1.5%的電壓穩(wěn)定度,而不是標準的±5%規(guī)格。保持內(nèi)核電壓在1V(而不是較大值1.05V),可將泄漏導(dǎo)致的靜態(tài)功耗降低15%,同時動態(tài)功耗降低10%。
降低FPGA結(jié)溫的一種簡單明顯的方法是利用散熱更好的PCB或散熱器。然后,F(xiàn)PGA設(shè)計人員只要能夠降低功耗的改變都是值得鼓勵的。在結(jié)溫100℃左右時,15℃的溫度降低可以將源于泄漏導(dǎo)致的靜態(tài)功耗降低20%。
通過監(jiān)控FPGA中的溫度和電壓也可以降低功耗。Virtex-5 FPGA中包含了一個稱為System Monitor的模擬模塊,可以監(jiān)控外部和內(nèi)部模擬電壓以及芯片內(nèi)部溫度。System Monitor基于一個10位的A/D變換器,能夠在-40℃至+125℃范圍內(nèi)提供準確可靠的測量結(jié)果。A/D變換器將片上傳感器的輸出數(shù)字化,可以利用它來監(jiān)控多達17路外部模擬輸入,從而監(jiān)控系統(tǒng)性能與外部環(huán)境。模塊內(nèi)包括了可配置的閾值和告警電平,并且可以在可配置的寄存器內(nèi)存儲測量結(jié)果,因此可方便地接口到用戶邏輯或微處理器。
此外,I/O功率成為在功耗和性能平衡過程中需要考慮的另一重要因素,通過更為優(yōu)化的I/O選擇可以進一步
相關(guān)閱讀:
- ...2011/08/26 13:37·Xilinx Zynq-7000 EPP為創(chuàng)新開啟新時代
- ...2011/03/25 10:57·在Multisim環(huán)境中對Xilinx 可編程邏輯設(shè)備進行編程
- ...2009/06/02 15:08·基于Xilinx器件的CPRI協(xié)議實現(xiàn)方法
- ...2008/08/15 15:42·Xilinx低成本顯示器解決方案
- ...· “芯創(chuàng)杯”首屆高校未來汽車人機交互設(shè)計大賽報名正式啟動
- ...· 探秘第二屆衛(wèi)藍山鷹“創(chuàng)新·共享”試驗技術(shù)論壇!
- ...· “2018中國半導(dǎo)體生態(tài)鏈大會”在江蘇省盱眙舉行
- ...· 新主題新規(guī)劃,CITE 2019瞭望智慧未來
- ...· 從汽車到工廠,TI毫米波傳感器致力于創(chuàng)造更智能的世界
- ...· 意法半導(dǎo)體(ST)、Cinemo和Valens在CES 2018展上聯(lián)合演示汽車信息娛樂解決方案
- ...· 北京集成電路產(chǎn)業(yè)創(chuàng)新發(fā)展高峰論壇即將在京召開
- ...· 三菱電機強勢出擊PCIM亞洲2017展
- ...· GPGPU國產(chǎn)替代:中國芯片產(chǎn)業(yè)的空白地帶
- ...· 物聯(lián)網(wǎng)產(chǎn)品設(shè)計中Wi-Fi連接的四個關(guān)鍵因素
- ...· 第三屆中國MEMS智能傳感器產(chǎn)業(yè)發(fā)展大會即將于蚌埠拉開帷幕
- ...· IAIC專項賽演繹“中國芯“應(yīng)用創(chuàng)新,信息安全高峰論壇亮劍海寧
- ...· 智能控制有源鉗位反激
- ...· 解讀5G毫米波OTA 測試技術(shù)
- ...· 多個市場高速增長推動Molex加強汽車領(lǐng)域的發(fā)展
- ...· 中國綠色制造聯(lián)盟成立大會召開在即 政產(chǎn)學(xué)研用共探綠色發(fā)展新模式
- ...· Efinix® 全力驅(qū)動AI邊緣計算,成功推出Trion™ T20 FPGA樣品, 同時將產(chǎn)品擴展到二十萬邏輯單元的T200 FPGA
- ...· 英飛凌亮相進博會,引領(lǐng)智慧新生活
- ...· 三電產(chǎn)品開發(fā)及測試研討會北汽新能源專場成功舉行
- ...· Manz亞智科技跨入半導(dǎo)體領(lǐng)域 為面板級扇出型封裝提供化學(xué)濕制程、涂布及激光應(yīng)用等生產(chǎn)設(shè)備解決方案
- ...· 中電瑞華BITRODE動力電池測試系統(tǒng)順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測試系統(tǒng)中標北京新能源汽車股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負載系統(tǒng)成功交付中電熊貓
- ...· 中電瑞華國際在電動汽車及關(guān)鍵部件測評研討會上演繹先進測評技術(shù)
- ...· 數(shù)據(jù)采集終端系統(tǒng)設(shè)備
- ...· 簡儀科技踏上新征程
- ...· 易靈思® 宣布 AEC-Q100 資質(zhì)認證和汽車系列產(chǎn)品計劃
- ...· 易靈思® 宣布擴充高性能 鈦金系列™ FPGA 產(chǎn)品 鈦金系列產(chǎn)品擴充至包含 1M 邏輯單元的 FPGA
- ...· 易靈思® 宣布Trion® Titanium 在臺積電 (TSMC) 16納米工藝節(jié)點流片
- ...· TI杯2019年全國大學(xué)生電子設(shè)計競賽頒獎典禮在京舉行
- ...· BlackBerry QNX虛擬機獲得全球首個汽車安全完整性等級(ASIL) ‘D’認證
- ...· 威馬汽車選擇BlackBerry助力下一代汽車