如何創(chuàng)建及諧調(diào)支持多核的LabVIEW x86客戶DLL
作者:
Stephen Blair-Chappell,技術(shù)支持工程師 - Intel (英國(guó)), working in partnership with Hitex UK Ltd.
產(chǎn)品:
軟件
挑戰(zhàn):
對(duì)NI LabVIEW軟件自動(dòng)生成的外部代碼進(jìn)行較優(yōu)化,在x86構(gòu)架下獲得較大性能,進(jìn)而測(cè)量目標(biāo)系統(tǒng)中DLL性能。
解決方案:
在不修改源代碼的條件下,通過(guò)Intel C++ 編譯器在單核PC上實(shí)現(xiàn)2.5 倍提速,通過(guò)編譯器中的各類(lèi)較優(yōu)化選項(xiàng)在雙核PC 上實(shí)現(xiàn)超過(guò)4.5 倍提速。
"VTune能夠監(jiān)測(cè)許多不同種類(lèi)的構(gòu)架事件。VTune調(diào)諧助手能夠給出如何更好使用這些事件的建議。"
本應(yīng)用包括了兩個(gè)組件——用于計(jì)算Pi 值的DLL、調(diào)用DLL 庫(kù)函數(shù)的LabVIEW 應(yīng)用,可將結(jié)果顯示在圖形用戶界面中。
為計(jì)算Pi 值,我們采用了近似綜合技術(shù),需要在單個(gè)循環(huán)中完成數(shù)百萬(wàn)次浮點(diǎn)計(jì)算。選擇該范例是因?yàn)樗荂PU 密集型的,并且是可優(yōu)化的應(yīng)用。如下所示為外部代碼的主循環(huán)結(jié)構(gòu),CPU的主要計(jì)算量是處理CalcSum 函數(shù)。
for(i=0; i<num_steps; i++)
{
sum = CalcSum(i, sum, step);
}
我們的目標(biāo)是通過(guò)編譯器中的優(yōu)化選項(xiàng)以較快速度完成上述計(jì)算。
應(yīng)用中有4 個(gè)函數(shù),均包含于獨(dú)立源文件中。我們采用不同優(yōu)化開(kāi)關(guān)來(lái)編譯每個(gè)源文件。如圖1 所示。
表1.應(yīng)用中的函數(shù)
“即插即用”的Intel C++ 編譯器
我們采用即插即用的Intel C++ 來(lái)代替Microsoft 編譯器,它可以輕松地集成到現(xiàn)有Microsoft Visual Studio DLL 工程中。更多關(guān)于Intel 編譯器,請(qǐng)?jiān)L問(wèn)intel.com/software。
默認(rèn)設(shè)置
測(cè)量首先以/O2選項(xiàng)創(chuàng)建應(yīng)用,許多優(yōu)化都是在這個(gè)層面上進(jìn)行的。本文在此不討論其細(xì)節(jié)問(wèn)題。表2顯示了/O2選項(xiàng)集成的各個(gè)優(yōu)化設(shè)置。
表2./O2 選項(xiàng)中集成的較優(yōu)化列表
自動(dòng)向量化
自動(dòng)向量化得益于新一代CPU 中集成的復(fù)雜指令集。多數(shù)現(xiàn)代CPU構(gòu)架可擴(kuò)展支持?jǐn)?shù)據(jù)操作及多數(shù)據(jù)計(jì)算。擴(kuò)展包括支持以單一指令實(shí)現(xiàn)多重計(jì)算(單指令多數(shù)據(jù)流,或稱SIMD)。Intel 編譯器能夠分析代碼,并通過(guò)SIMD 指令顯著提高代碼的效率。
本范例中,編譯器通過(guò)\QT 選項(xiàng)生成適合Core 2 構(gòu)架的代碼,編譯器報(bào)告以下創(chuàng)建時(shí)間信息:
注釋:循環(huán)未作向量化處理
反匯編生成代碼后可看到編譯器插入了SIMD擴(kuò)展指令集(SSE)。該指令集的使用直接提升了應(yīng)用的運(yùn)行性能,代碼運(yùn)行速度提高了2倍。
這類(lèi)優(yōu)化可應(yīng)用于目前大多數(shù)CPU 上,這里我們?cè)贑ore 2 處理器上運(yùn)行,當(dāng)然您也可以在單核或早期CPU 上應(yīng)用。
自動(dòng)并行化
因?yàn)椴捎枚嗪薖C,我們會(huì)更感興趣如何通過(guò)\QParallel 選項(xiàng),讓代碼在兩核上同時(shí)運(yùn)行,以獲得進(jìn)一步提速。該選項(xiàng)在編譯目標(biāo)中插入了庫(kù)調(diào)用。庫(kù)調(diào)用提供了運(yùn)行時(shí)所需的控制,使應(yīng)用中的組件得以并行。
在首次運(yùn)行中,編譯器并未顯著提高運(yùn)行性能。通過(guò)開(kāi)啟編譯器的報(bào)告功能,可以看到它并未進(jìn)行優(yōu)化。
注釋:循環(huán)未作并行化處理,循環(huán)無(wú)需并行化
Intel編譯器要對(duì)一段代碼進(jìn)行自動(dòng)并行化時(shí),首先決定是否有值得進(jìn)行并行化的代碼部分。在我們的代碼中由一個(gè)主循環(huán)完成所有工作。編譯器不能確定循環(huán)的重復(fù)次數(shù),循環(huán)計(jì)數(shù)值只有在運(yùn)行時(shí)得到。于是編譯器采取謹(jǐn)慎選擇,不對(duì)循環(huán)進(jìn)行并行化處理。
我們可以通過(guò)在命令行輸入/Qpar-threshold:n 來(lái)進(jìn)行試探優(yōu)化,這里n 是介于0(總是并行處理)到100(不進(jìn)行并行處理)的數(shù),這個(gè)值決定了試探優(yōu)化的程度。
輸入/Qpar-threshold:0 后,編譯器對(duì)代碼并行化,并輸出報(bào)告:
注釋:循環(huán)已作自動(dòng)并行化處理
使用該優(yōu)化后,程序的運(yùn)行速度比默認(rèn)設(shè)置下提高了近2 倍。
其它優(yōu)化選項(xiàng)
本范例中,我們關(guān)注自動(dòng)向量化及自動(dòng)并行化。Intel C++ 編譯器利用一系列其它優(yōu)化技術(shù),包括高層優(yōu)化、交叉過(guò)程優(yōu)化、配置向?qū)?yōu)化、速度優(yōu)化、代碼大小優(yōu)化、快速浮點(diǎn)處理等。
Intel 編譯器同時(shí)支持OpenMP 這個(gè)基于pragma 的標(biāo)準(zhǔn),用于實(shí)現(xiàn)應(yīng)用代碼的并行化。
測(cè)量性能
本范例中我們采用Win32 API 的定時(shí)函數(shù),并將定時(shí)計(jì)算嵌入外部代碼。計(jì)算時(shí)間在LabVIEW 應(yīng)用GUI 中顯示。
作為備選,我們還可采用LabVIEW的定時(shí)工具,或采用外部工具,如Intel VTune 性能分析器。
VTune能夠監(jiān)測(cè)許多不同種類(lèi)的構(gòu)架事件。VTune調(diào)諧助手能夠給出如何更好使用這些事件的建議。
結(jié)論
不同開(kāi)關(guān)的優(yōu)化結(jié)果在表3 中列出。我們?cè)陔p核PC 上運(yùn)行,并通過(guò)默認(rèn)優(yōu)化(/O2)作為基準(zhǔn)來(lái)計(jì)算提速。
表3.不同優(yōu)化方式下的速度提高
在應(yīng)用自動(dòng)向量化時(shí)可達(dá)到2.5倍速,該優(yōu)化專用于非多核處理器,可用于目前多數(shù)CPU。
在應(yīng)用自動(dòng)并行化后可實(shí)現(xiàn)接近2 倍的提速。結(jié)合兩種優(yōu)化更可達(dá)到4.6 倍。
以上結(jié)果是在不修改源代碼的前提下實(shí)現(xiàn)的。盡管我們選擇了模擬應(yīng)用(計(jì)算Pi值),但這類(lèi)優(yōu)化技術(shù)能夠用于各類(lèi)實(shí)際應(yīng)用。從Intel編譯器用戶反饋中了解到,使用這些優(yōu)化方式可顯著提高代碼執(zhí)行速度。
相關(guān)閱讀:
- ...·圖文詳解汽車(chē)儀表板背后的車(chē)規(guī)級(jí)安全設(shè)計(jì)要求
- ...·使用有安全保障的閃存存儲(chǔ)構(gòu)建安全的汽車(chē)系統(tǒng)
- ...·反向偏置差分線性傳感器的較新進(jìn)展和應(yīng)用
- ...·艾德克斯測(cè)評(píng)某品牌智能插座——待機(jī)功耗篇
- ...·三線電阻式溫度檢測(cè)器測(cè)量系統(tǒng)中勵(lì)磁電流失配的影響(續(xù))
- ...·三線電阻式溫度檢測(cè)器測(cè)量系統(tǒng)中勵(lì)磁電流失配的影響
- ...·RTD測(cè)量系統(tǒng)中勵(lì)磁電流失配的影響
- ...·藍(lán)牙BR/EDR 和 Bluetooth Smart的十大重要區(qū)別
- ...·IoT網(wǎng)關(guān)平臺(tái)與應(yīng)用
- ...·增強(qiáng)版ARM DesignStart:通向定制化SoC的較快、較低風(fēng)險(xiǎn)之路
- ...·實(shí)體零售轉(zhuǎn)型O2O,倉(cāng)儲(chǔ)物流的智能化水平從何提升?
- ...·幾種車(chē)用LED驅(qū)動(dòng)方案的比較
- ...·藍(lán)牙配對(duì)第二篇:密鑰生成方法
- ...·中電瑞華推出領(lǐng)先的無(wú)線數(shù)據(jù)采集解決方案
- ...·安森美半導(dǎo)體配合市場(chǎng)趨勢(shì)的無(wú)線充電方案
- ...·安森美半導(dǎo)體配合汽車(chē)照明設(shè)計(jì)趨勢(shì)的解決方案
- ...· “芯創(chuàng)杯”首屆高校未來(lái)汽車(chē)人機(jī)交互設(shè)計(jì)大賽報(bào)名正式啟動(dòng)
- ...· 探秘第二屆衛(wèi)藍(lán)山鷹“創(chuàng)新·共享”試驗(yàn)技術(shù)論壇!
- ...· “2018中國(guó)半導(dǎo)體生態(tài)鏈大會(huì)”在江蘇省盱眙舉行
- ...· 新主題新規(guī)劃,CITE 2019瞭望智慧未來(lái)
- ...· 從汽車(chē)到工廠,TI毫米波傳感器致力于創(chuàng)造更智能的世界
- ...· 意法半導(dǎo)體(ST)、Cinemo和Valens在CES 2018展上聯(lián)合演示汽車(chē)信息娛樂(lè)解決方案
- ...· 北京集成電路產(chǎn)業(yè)創(chuàng)新發(fā)展高峰論壇即將在京召開(kāi)
- ...· 三菱電機(jī)強(qiáng)勢(shì)出擊PCIM亞洲2017展
- ...· GPGPU國(guó)產(chǎn)替代:中國(guó)芯片產(chǎn)業(yè)的空白地帶
- ...· 物聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)中Wi-Fi連接的四個(gè)關(guān)鍵因素
- ...· 第三屆中國(guó)MEMS智能傳感器產(chǎn)業(yè)發(fā)展大會(huì)即將于蚌埠拉開(kāi)帷幕
- ...· IAIC專項(xiàng)賽演繹“中國(guó)芯“應(yīng)用創(chuàng)新,信息安全高峰論壇亮劍海寧
- ...· 智能控制有源鉗位反激
- ...· 解讀5G毫米波OTA 測(cè)試技術(shù)
- ...· 多個(gè)市場(chǎng)高速增長(zhǎng)推動(dòng)Molex加強(qiáng)汽車(chē)領(lǐng)域的發(fā)展
- ...· 中國(guó)綠色制造聯(lián)盟成立大會(huì)召開(kāi)在即 政產(chǎn)學(xué)研用共探綠色發(fā)展新模式
- ...· Efinix® 全力驅(qū)動(dòng)AI邊緣計(jì)算,成功推出Trion™ T20 FPGA樣品, 同時(shí)將產(chǎn)品擴(kuò)展到二十萬(wàn)邏輯單元的T200 FPGA
- ...· 英飛凌亮相進(jìn)博會(huì),引領(lǐng)智慧新生活
- ...· 三電產(chǎn)品開(kāi)發(fā)及測(cè)試研討會(huì)北汽新能源專場(chǎng)成功舉行
- ...· Manz亞智科技跨入半導(dǎo)體領(lǐng)域 為面板級(jí)扇出型封裝提供化學(xué)濕制程、涂布及激光應(yīng)用等生產(chǎn)設(shè)備解決方案
- ...· 中電瑞華BITRODE動(dòng)力電池測(cè)試系統(tǒng)順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測(cè)試系統(tǒng)中標(biāo)北京新能源汽車(chē)股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負(fù)載系統(tǒng)成功交付中電熊貓
- ...· 中電瑞華國(guó)際在電動(dòng)汽車(chē)及關(guān)鍵部件測(cè)評(píng)研討會(huì)上演繹先進(jìn)測(cè)評(píng)技術(shù)
- ...· 數(shù)據(jù)采集終端系統(tǒng)設(shè)備
- ...· 簡(jiǎn)儀科技踏上新征程
- ...· 易靈思® 宣布 AEC-Q100 資質(zhì)認(rèn)證和汽車(chē)系列產(chǎn)品計(jì)劃
- ...· 易靈思® 宣布擴(kuò)充高性能 鈦金系列™ FPGA 產(chǎn)品 鈦金系列產(chǎn)品擴(kuò)充至包含 1M 邏輯單元的 FPGA
- ...· 易靈思® 宣布Trion® Titanium 在臺(tái)積電 (TSMC) 16納米工藝節(jié)點(diǎn)流片
- ...· TI杯2019年全國(guó)大學(xué)生電子設(shè)計(jì)競(jìng)賽頒獎(jiǎng)典禮在京舉行
- ...· BlackBerry QNX虛擬機(jī)獲得全球首個(gè)汽車(chē)安全完整性等級(jí)(ASIL) ‘D’認(rèn)證
- ...· 威馬汽車(chē)選擇BlackBerry助力下一代汽車(chē)