PGI 8.0版多核x64處理器用優(yōu)化編譯器及開(kāi)發(fā)工具
意法半導(dǎo)體全資子公司Portland Group®公布支持 Linux、Mac OS X和Windows三大操作系統(tǒng)的PGI® 8.0版高性能編譯器及開(kāi)發(fā)工具系列產(chǎn)品。在所支持的三大平臺(tái)上,PGI 8.0版Fortran和C編譯器均全面支持較近發(fā)布的OpenMP 3.0多核并行編程標(biāo)準(zhǔn)。新版軟件還支持在Linux和MacOS平臺(tái)上開(kāi)發(fā)和調(diào)試OpenMPI應(yīng)用程序,并完善了現(xiàn)有MPI編譯程序在Linux和Windows集群上的功能。目前,PGI 8.0版用戶(hù)通過(guò)使用完全相同的PGI編譯器、較新的OpenMP功能、可選的MPI軟件和捆綁的OpenMP/MPI調(diào)試器和分析工具,可以在任何一款主流的臺(tái)式機(jī)或服務(wù)器集群操作系統(tǒng)上開(kāi)發(fā)部署多核和并行的應(yīng)用程序。作為具有重要意義的全新開(kāi)發(fā)成果,PGI 8.0版標(biāo)志著Portland Group開(kāi)始進(jìn)入加速計(jì)算領(lǐng)域,可以條件性支持并行計(jì)算任務(wù),從x64主處理器自動(dòng)分配到英偉達(dá)(NVIDIA)的具有CUDA功能的GPU處理器。 .
“PGI的Unified Binary技術(shù)使開(kāi)發(fā)人員能夠利用AMD和英特爾的較新的CPU創(chuàng)新技術(shù),同時(shí)把不同的x64 處理器視為一個(gè)單一平臺(tái),配合PGI 8.0版的新增功能,為HPC用戶(hù)和大型多平臺(tái)超級(jí)計(jì)算中心提供了較大的靈活性和自主性。”P(pán)ortland Group總監(jiān)Douglas Miles表示。
全新的性能分析工具
現(xiàn)有編譯器及開(kāi)發(fā)工具產(chǎn)品線已包含目前所有的較佳的HPC方法和多核編程技術(shù)。除了延續(xù)現(xiàn)有產(chǎn)品線的成功之處外,PGI 8.0版編譯器還增加了一個(gè)全新的功能:自動(dòng)分析源代碼,然后生成一個(gè)巨大的數(shù)據(jù)庫(kù),描述可行的或被抑制的性能優(yōu)化方案,并提供源代碼的修改意見(jiàn),以便利用可行的優(yōu)化措施。隨著8.0版編譯器的推出,PGI利用通用編譯器反饋格式(CCFF)使數(shù)據(jù)重組和訪問(wèn)數(shù)據(jù)的界面實(shí)現(xiàn)了標(biāo)準(zhǔn)化。為了努力改進(jìn)PGI、第三方和高性能計(jì)算產(chǎn)業(yè)的軟件調(diào)試工具的可用性和互操作性,PGI正在公布CCFF標(biāo)準(zhǔn),業(yè)內(nèi)人士可以免費(fèi)獲得這項(xiàng)標(biāo)準(zhǔn)。登錄PGI網(wǎng)站http://www.pgroup.com/ccff可以獲得更詳細(xì)的CCFF的信息。
在一個(gè)結(jié)構(gòu)合理而緊湊的直觀的圖形用戶(hù)界面(GUI)內(nèi),PGI的PGPROF®8.0性能分析工具可以顯示CCFF數(shù)據(jù)以及用戶(hù)源代碼,同時(shí)還支持命令行界面。程序員可以迅速簡(jiǎn)易地發(fā)現(xiàn)結(jié)構(gòu)合理的代碼段,以及性能有待改進(jìn)的需要重組的代碼段。除能夠識(shí)別占用計(jì)算機(jī)時(shí)間或系統(tǒng)資源較多的應(yīng)用程序代碼段外,PGPROF還為程序員提供具體且可行的源代碼性能優(yōu)化反饋建議。通過(guò)識(shí)別以下內(nèi)容,以每個(gè)線程和/或每個(gè)進(jìn)程顯示數(shù)據(jù)的方法能夠簡(jiǎn)化性能調(diào)試:
- 單指令多數(shù)據(jù)流擴(kuò)展(SSE)矢量回路,以及矢量化在非矢量回路受限制的原因
- 多核用自動(dòng)并行化回路,和并行化在串行回路上受限的原因
- OpenMP并行化的備選回路
- 回路的計(jì)算強(qiáng)度,把負(fù)荷分配給圖形處理器(GPU)或加速器所需的備選回路
- 迭代數(shù)量極大或極小的回路,以及SSE和高速緩存分層架構(gòu)性能的優(yōu)化方法
- 數(shù)據(jù)預(yù)取,通過(guò)指令和pragmas命令優(yōu)化數(shù)據(jù)預(yù)取的機(jī)會(huì)
除這些詳細(xì)的分析外,PGPROF還提供程序級(jí)總體分析,包括行內(nèi)函數(shù)和例程的信息;每個(gè)文件是如何編譯的信息;整個(gè)系統(tǒng)配置的信息;以及 Fortran、C和C++源代碼的性能關(guān)鍵特性。傳統(tǒng)的性能調(diào)試工具只能報(bào)告和調(diào)試一個(gè)特殊類(lèi)型的處理器或系統(tǒng),或只能做并行化的調(diào)優(yōu)任務(wù),而PGI 8.0編譯器及開(kāi)發(fā)工具,能夠在現(xiàn)代化的多核 x64 CPU或GPU加速器上,為程序員提供調(diào)試反饋,以及通過(guò)重組回路和算法來(lái)提高性能的建議。
“計(jì)算機(jī)處理并行化并不等于高性能,”P(pán)ortland Group的編譯器工程師Michael Wolfe表示,“問(wèn)題的核心不是并行計(jì)算,而是系統(tǒng)性能,并行只不過(guò)是實(shí)現(xiàn)高性能的一個(gè)工具。”
臨時(shí)性GPU支持
PGI 8.0版還包含技術(shù)預(yù)覽,介紹業(yè)內(nèi)首款把x64主處理器的計(jì)算任務(wù)自動(dòng)分配給圖形處理器(GPU)的Fortran和C編譯器。直到現(xiàn)在,專(zhuān)注GPU加速器的C和C++開(kāi)發(fā)人員還必須依賴(lài)把語(yǔ)言擴(kuò)展到程序中。 從Fortran應(yīng)用程序調(diào)用GPU受到極大的限制,需要x64+GPU程序員進(jìn)行詳細(xì)的編程,包括必須理解和指定數(shù)據(jù)用途信息,管理x64主處理器和GPU之間的所有數(shù)據(jù)傳輸需要人工排列調(diào)用序列。采用PGI 8.0版的臨時(shí)性支持功能,通過(guò)給現(xiàn)有的兼容高級(jí)標(biāo)準(zhǔn)的Fortran和C程序增加類(lèi)似于 OpenMP的編譯器指令,然后選擇適合的編譯器重新編譯,程序員可以在x64+GPU 平臺(tái)上加快Linux應(yīng)用程序的開(kāi)發(fā)和部署。
“越來(lái)越多的軟件發(fā)行商利用CUDA開(kāi)發(fā)環(huán)境,開(kāi)發(fā)創(chuàng)新的解決方案,充分發(fā)揮英偉達(dá)GPU的強(qiáng)大性能,PGI正在加入到這個(gè)行列中來(lái),”英偉達(dá)Tesla計(jì)算解決方案總經(jīng)理Andy Keane表示,“憑借他們20年的開(kāi)發(fā)歷史和輝煌業(yè)績(jī),我們期待PGI的解決方案給高性能計(jì)算產(chǎn)業(yè)創(chuàng)造機(jī)會(huì),使開(kāi)發(fā)人員能夠逐漸移植大量的傳統(tǒng)的科研和工程代碼,以充分利用英偉達(dá)Tesla加速器的優(yōu)勢(shì)。”
PGI 8.0 x64+GPU編譯器自動(dòng)分析整個(gè)程序結(jié)構(gòu)和數(shù)據(jù),在x64 CPU和GPU 之間分配用戶(hù)指令規(guī)定的應(yīng)用程序代碼,定義并生成一個(gè)優(yōu)化的回路映射,自動(dòng)使用并行內(nèi)核、硬件線程功能和現(xiàn)代GPU的SIMD矢量功能。除規(guī)定代碼區(qū)域和加速功能的指令和pragma命令外,PGI Fortran和C編譯器還支持用于精細(xì)控制回路映射、存儲(chǔ)單元分配和GPU存儲(chǔ)分層架構(gòu)優(yōu)化的用戶(hù)指令。PGI編譯器生成統(tǒng)一的x64+GPU目標(biāo)文件和管理數(shù)據(jù)進(jìn)出CPU的可執(zhí)行文件,同時(shí)還充分利用主處理器側(cè)的開(kāi)發(fā)實(shí)用工具——鏈接程序、函數(shù)庫(kù)、makefiles,無(wú)需修改現(xiàn)有標(biāo)準(zhǔn)的高性能計(jì)算Linux/x64編程環(huán)境。
PGI8.0版的另一新亮點(diǎn)是:在Mac OS X上支持OpenMP并行和本機(jī)OpenMPI并行調(diào)試;在Microsoft Windows上新簡(jiǎn)化的授權(quán)設(shè)置;支持Microsoft HPC Server 2008集群;支持AMD和英特爾較新的處理器。
相關(guān)閱讀:
- ...2012/11/23 15:57·PGI Accelerator編譯器支持英偉達(dá)全新Tesla K20系列GPU加速器
- ...2012/11/22 12:04·PGI將OpenACC技術(shù)擴(kuò)展至英特爾Xeon Phi協(xié)處理器
- ...2012/04/18 20:55·Portland Group發(fā)布首款可支持OpenACC的PGI編譯器
- ...2010/10/12 11:08·PGI為x86平臺(tái)開(kāi)發(fā)基于NVIDIA CUDA C 架構(gòu)的編譯器
- ...2010/07/19 10:32·Portland Group發(fā)布支持Visual Studio 2010版的PGI Visual Fortran編譯器
- ...2010/05/26 10:21·Gaussian 09軟件通過(guò)PGI編譯器移植到64位Mac OS X操作系統(tǒng)
- ...· “芯創(chuàng)杯”首屆高校未來(lái)汽車(chē)人機(jī)交互設(shè)計(jì)大賽報(bào)名正式啟動(dòng)
- ...· 探秘第二屆衛(wèi)藍(lán)山鷹“創(chuàng)新·共享”試驗(yàn)技術(shù)論壇!
- ...· “2018中國(guó)半導(dǎo)體生態(tài)鏈大會(huì)”在江蘇省盱眙舉行
- ...· 新主題新規(guī)劃,CITE 2019瞭望智慧未來(lái)
- ...· 從汽車(chē)到工廠,TI毫米波傳感器致力于創(chuàng)造更智能的世界
- ...· 意法半導(dǎo)體(ST)、Cinemo和Valens在CES 2018展上聯(lián)合演示汽車(chē)信息娛樂(lè)解決方案
- ...· 北京集成電路產(chǎn)業(yè)創(chuàng)新發(fā)展高峰論壇即將在京召開(kāi)
- ...· 三菱電機(jī)強(qiáng)勢(shì)出擊PCIM亞洲2017展
- ...· GPGPU國(guó)產(chǎn)替代:中國(guó)芯片產(chǎn)業(yè)的空白地帶
- ...· 物聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)中Wi-Fi連接的四個(gè)關(guān)鍵因素
- ...· 第三屆中國(guó)MEMS智能傳感器產(chǎn)業(yè)發(fā)展大會(huì)即將于蚌埠拉開(kāi)帷幕
- ...· IAIC專(zhuān)項(xiàng)賽演繹“中國(guó)芯“應(yīng)用創(chuàng)新,信息安全高峰論壇亮劍海寧
- ...· 智能控制有源鉗位反激
- ...· 解讀5G毫米波OTA 測(cè)試技術(shù)
- ...· 多個(gè)市場(chǎng)高速增長(zhǎng)推動(dòng)Molex加強(qiáng)汽車(chē)領(lǐng)域的發(fā)展
- ...· 中國(guó)綠色制造聯(lián)盟成立大會(huì)召開(kāi)在即 政產(chǎn)學(xué)研用共探綠色發(fā)展新模式
- ...· Efinix® 全力驅(qū)動(dòng)AI邊緣計(jì)算,成功推出Trion™ T20 FPGA樣品, 同時(shí)將產(chǎn)品擴(kuò)展到二十萬(wàn)邏輯單元的T200 FPGA
- ...· 英飛凌亮相進(jìn)博會(huì),引領(lǐng)智慧新生活
- ...· 三電產(chǎn)品開(kāi)發(fā)及測(cè)試研討會(huì)北汽新能源專(zhuān)場(chǎng)成功舉行
- ...· Manz亞智科技跨入半導(dǎo)體領(lǐng)域 為面板級(jí)扇出型封裝提供化學(xué)濕制程、涂布及激光應(yīng)用等生產(chǎn)設(shè)備解決方案
- ...· 中電瑞華BITRODE動(dòng)力電池測(cè)試系統(tǒng)順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測(cè)試系統(tǒng)中標(biāo)北京新能源汽車(chē)股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負(fù)載系統(tǒng)成功交付中電熊貓
- ...· 中電瑞華國(guó)際在電動(dòng)汽車(chē)及關(guān)鍵部件測(cè)評(píng)研討會(huì)上演繹先進(jìn)測(cè)評(píng)技術(shù)
- ...· 數(shù)據(jù)采集終端系統(tǒng)設(shè)備
- ...· 簡(jiǎn)儀科技踏上新征程
- ...· 易靈思® 宣布 AEC-Q100 資質(zhì)認(rèn)證和汽車(chē)系列產(chǎn)品計(jì)劃
- ...· 易靈思® 宣布擴(kuò)充高性能 鈦金系列™ FPGA 產(chǎn)品 鈦金系列產(chǎn)品擴(kuò)充至包含 1M 邏輯單元的 FPGA
- ...· 易靈思® 宣布Trion® Titanium 在臺(tái)積電 (TSMC) 16納米工藝節(jié)點(diǎn)流片
- ...· TI杯2019年全國(guó)大學(xué)生電子設(shè)計(jì)競(jìng)賽頒獎(jiǎng)典禮在京舉行
- ...· BlackBerry QNX虛擬機(jī)獲得全球首個(gè)汽車(chē)安全完整性等級(jí)(ASIL) ‘D’認(rèn)證
- ...· 威馬汽車(chē)選擇BlackBerry助力下一代汽車(chē)
- ...·圖文詳解汽車(chē)儀表板背后的車(chē)規(guī)級(jí)安全設(shè)計(jì)要求
- ...·使用有安全保障的閃存存儲(chǔ)構(gòu)建安全的汽車(chē)系統(tǒng)
- ...·反向偏置差分線性傳感器的較新進(jìn)展和應(yīng)用
- ...·艾德克斯測(cè)評(píng)某品牌智能插座——待機(jī)功耗篇
- ...·三線電阻式溫度檢測(cè)器測(cè)量系統(tǒng)中勵(lì)磁電流失配的影響(續(xù))
- ...·三線電阻式溫度檢測(cè)器測(cè)量系統(tǒng)中勵(lì)磁電流失配的影響
- ...·RTD測(cè)量系統(tǒng)中勵(lì)磁電流失配的影響
- ...·藍(lán)牙BR/EDR 和 Bluetooth Smart的十大重要區(qū)別
- ...·IoT網(wǎng)關(guān)平臺(tái)與應(yīng)用
- ...·增強(qiáng)版ARM DesignStart:通向定制化SoC的較快、較低風(fēng)險(xiǎn)之路
- ...·實(shí)體零售轉(zhuǎn)型O2O,倉(cāng)儲(chǔ)物流的智能化水平從何提升?
- ...·幾種車(chē)用LED驅(qū)動(dòng)方案的比較
- ...·藍(lán)牙配對(duì)第二篇:密鑰生成方法
- ...·中電瑞華推出領(lǐng)先的無(wú)線數(shù)據(jù)采集解決方案
- ...·安森美半導(dǎo)體配合市場(chǎng)趨勢(shì)的無(wú)線充電方案
- ...·安森美半導(dǎo)體配合汽車(chē)照明設(shè)計(jì)趨勢(shì)的解決方案