亚洲精品影院一区二区-亚洲精品永久一区-亚洲精品中文一区不卡-亚洲精品中文字幕久久久久久-国产亚洲精品aaa大片-国产亚洲精品成人a在线

您好,歡迎光臨電子應用網![登錄] [免費注冊] 返回首頁 | | 網站地圖 | 反饋 | 收藏
在應用中實踐
在實踐中成長
  • 應用
  • 專題
  • 產品
  • 新聞
  • 展會
  • 活動
  • 招聘
當前位置:電子應用網 > 新聞中心 > 正文

Kalray MPPA解決方案實現無處不在的低功耗、實時單芯片超算

2015年10月13日20:23:05 本網站 我要評論(2)字號:T | T | T

大規模并行處理器陣列芯片為數據中心及高性能嵌入式應用提供澎湃動力

超級計算,對很多人來說并不陌生但仿佛又離得很遠,或許大家對它的了解也僅僅限于“天河”超級計算機。其實,隨著越來越多的應用對實時數值計算和數據處理提出極高的要求,超級計算正在越來越多地出現在與人類生活息息相關的領域。尤其是近些年來,隨著云計算、大數據等IT新概念和新技術的出現,以及先進無損音視頻處理和自動駕駛設備等嵌入式高性能計算的興起,使很多原有應用迎來了突破性進展,并促使很多新的IT應用模式出現。而在這些應用背后,許多廠商正在全力實現的“嵌入式”實時超級計算解決方案,可以提供芯片級的高性能數據運算和處理能力。為此,北京華興萬邦管理咨詢有限公司走訪了業內率先實現單芯片超算(Supercomputing on a Chip)商用的法國Kalray公司,為大家一探“片上超算給行業帶來的新機會。

面向超級計算的多核處理器

為了完成普通PC或服務器無法完成的大量、復雜的計算任務,超級計算機要求擁有為數眾多的處理器。然而,隨著對運算速度越來越高的追求,單核處理器已經無法滿足超級計算的要求,因為無休止地增加單核處理器的數量不但會造成成本和功耗的大量增加,而且性能也無法呈現幾何級數的增長。于是,多核技術開始被大量應用于超級計算當中。以中國的“天河二號”超級計算機為例,其使用的主處理器和協處理器目前均為Intel公司的多核處理器。

目前,市場上研發并供應多核處理器芯片的廠商為數眾多,以IntelAMD兩大處理器廠商為首,不同的多核處理器所面向的應用領域也不盡相同。除了面向PC應用的2核、4核處理器和面向手機和平板電腦的4核、8核處理器外,一些供應商推出的8核、16核處理器也已實現全面的商用,例如XMOS公司的xCORE系列多核處理器已被高解析度音頻、千兆網速物聯網等領域中的產品、解決方案所采用,該公司全新的xCORE-200多核微控制器通過在單一器件上集成16個或更多高性能32RISC處理器內核,成為了高性能用戶、專業音頻與新興千兆網速物聯網(IoT)應用的完美可編程平臺。

在眾多的多核處理器供應商中,有一家面向超級計算相關應用的廠商正在越來越多地引起業界的關注,這就是全球首家可以提供256核以上處理器芯片的廠商——法國公司Kalray。Kalray公司是在單芯片上實現超級計算(Supercomputing on a Chip)的發明者,其大規模并行處理器陣列芯片MPPA®Massively Parallel Processor Array)處理器采用臺積電(TSMC)的28nm工藝制程,擁有超過256個可以進行C/C++編程的內核。該公司的單芯片超算解決方案可以為兩大類應用提供高性能、低功耗和實時等特性,一類是在數據中心、視頻處理等應用中卸載主處理器的任務,另一類是需要較大量數據處理、高實時性和低功耗的嵌入式應用。下面為您具體介紹該公司的解決方案及其商業應用。

Kalray公司的256MPPA處理器芯片

低功耗256核處理器芯片和標準C/C++編程環境

Kalray公司是一家成立于2008年的無晶圓廠半導體公司,它是開發多核處理器解決方案的先鋒廠商。該公司創新的MPPA架構獨一無二地提供單芯片超算解決方案,其可以為視頻、網絡、電信、大數據等領域的云計算應用實現實時加速,還可以為航空航天、國防、汽車等領域的嵌入式應用提供嵌入式高性能運算能力。Kalray公司的總部位于法國,包括位于巴黎和歐洲硅谷格勒諾布爾市(Grenoble)兩個地點的辦公室,此外,其在美國加州和日本東京還設有分公司。

Kalray公司的完整解決方案包括MPPA系列多核處理器、PCIe Gen3加速卡、提供網絡加速支持的開源網絡接口卡(Open NIC),以及軟件開發工具包。該解決方案可以提供行業領先的低計算功耗,具有時間可預測性和低延遲性,以及獨一無二的處理擴展性和系統密度,可以在同一塊片芯上實現多種異構的應用,同時擁有很好的可編程性(包括標準C/C++OpenCL)。

MPPA多核處理器包括AndeyMPPABostan MPPA兩款產品。其中Andey為第一代MPPA處理器,已于2013年第1季度開始供貨。它擁有超過256個可以進行32位超長指令字C/C++編程的內核,單精度浮點運算速度可以達到210 GFLOPS(每秒十億次浮點運算),雙精度浮點運算速度可達70GFLOPS,運算速度可達0.7 TOPS(每秒萬億次運算)。該處理器擁有兩塊帶寬為12.8GB/s64DDR3內存,以及兩個由DMA支持的PCIe Gen3×8接口。Bostan為該公司即將推出的第二代MPPA處理器,目前已完成流片及樣片的封裝,將于2015年第4季度向先期客戶供貨。它的單精度浮點運算速度可以達到840 GFLOPS,雙精度浮點運算速度可達420 GFLOPS,運算速度可達1.4 TOPS,其他性能相比Andey MPPA有較大幅度的提升。

MPPA多核處理器采用Kalray獨一無二的架構設計。每個處理器芯片擁有4個四核主CPU 16計算集群,每個計算集群中又包括16個用戶核和1個系統核,每個用戶核則采用Kalray擁有專利的超長指令字架構進行設計。同時,其片上的DDR存儲器和以太網及PCIe接口模塊支持了數據的低延遲處理,并使芯片的整體功耗遠遠低于通用的多芯片組功耗,Andey MPPA處理器的典型功耗為12W,Bostan MPPA處理器的功耗為11W-30W。

Kalray公司獨一無二的處理器架構

為了驗證其MPPA處理器的高性能、低功耗特性,并推動其芯片產品的商用化,Kalray推出了采用MPPA處理器的系列網絡卡。KalrayPCIe Gen3加速卡包括TurboCard2TurboCard3兩款產品。TurboCard2加載了4Andey MPPA芯片,浮點運算速度可以達到0.9 TFLOPS(每秒萬億次浮點運算),存儲容量高達32GB,擁有8DDR3內存(總帶寬達80GB/s),并配有C/C++ GNU編譯器環境。TurboCard3TurboCard2的下一代產品,將于2015年底供貨,其加載了4Bostan MPPA芯片,浮點運算速度可以達到3.4 TFLOPSKalray的開源網絡接口卡ONIC80也將于2015年底開始供貨,它是完全可編程的網卡,運行Bostan MPPA芯片,擁有PCIe Gen3×16接口和8GB存儲容量,其大小與普通圖形加速單元類似,功耗為40W,可以使數據中心變得更加緊湊和冷靜。

Kalray公司的PCIe Gen3加速卡TurboCard2

開發工具體系是處理器生態體系中另一項非常重要的指標。為了便于工程師針對不同的應用開發自己的超算解決方案,Kalray提供了方便易用、內容豐富的軟件開發工具包,包括標準C/C++編程環境,模擬器、編譯器、調試器和系統跟蹤,第三方實時操作系統(如Linux、風河)和設備驅動程序,面向CPU的基礎C編程和Lib編程,面向DSPPOSIX多線程編程,以及面向GPUOpenCL編程?梢哉f,該軟件開發工具包提供了眾多高性能應用所需求的軟件,工程師不需要針對該系列處理器進行大量重新學習就可以上手,并力求較大限度地發揮MPPA多核處理器的全部性能。

Kalray公司的軟件開發工具包

目標市場:數據中心和關鍵任務型嵌入式應用

通過上述對Kalray公司各種硬件產品性能的描述可以看出,它們能夠在很多對數據運算和處理有高要求的應用領域發揮重要作用,加上軟件開發工具包提供的強力支持,其整體解決方案擁有非常廣闊的應用空間。該公司的銷售和營銷副總裁Jean-Pierre Demange向分析師介紹:“在數據中心的工作過程中,隨著大量應用轉向云端,數據通信量的激增,以及新數據中心體系的進一步虛擬化需求,開始出現一種逐漸增長的需求,即從主流處理器(x86)向高性能、低功耗、低延遲、完全可編程的協處理器進行集中、實時卸載處理的需求。Kalray的處理器和PCI卡可以提供獨一無二的解決方案來幫助數據中心實現這一功能,主要應用范圍包括智能網卡、智能存儲、運算加速、視頻編碼等。

“除數據中心外,我們的解決方案還有一個重要的目標應用市場,那就是關鍵任務型嵌入式應用!Kalray公司的銷售和營銷副總裁Jean-Pierre Demange繼續說道。“關鍵任務型嵌入式應用市場要求在固定的占板面積上提供越來越高的計算能力,以及在同一塊片芯上擁有越來越高的功能集成度,同時還要保留實時性支持和安全規范,而目前其他現有的多核架構尚無法滿足這些規范和要求的認證。Kalray是全球首家可以為關鍵任務型嵌入式應用提供全認證多核解決方案的公司,我們可以為航空航天、國防、自動汽車、機器人和多軸飛行器等應用領域提供支持。

Kalray公司的銷售與營銷副總裁Jean-Pierre Demange、首席執行官Eric Baissus和商務總監Stephane Cordova(從左至右)向華興萬邦分析師展示其產品

目前,Kalray公司已對其后續產品進行了合理的規劃,該公司的首席執行官Eric Baissus介紹道:“我們正在對第三代MPPA多核處理器Coolidge制定技術規范,這款芯片的單精度浮點運算速度預計將高于1200 GFLOPS,雙精度浮點運算速度預計將高于600 GFLOPS,計劃2017年初生產樣片,2017年年內實現量產!贝送猓P于未來對中國市場的開發,Eric Baissus先生也表達了自己的觀點:“目前,我們與中國企業的合作還較少,我們希望下一步能夠加強與中國市場的聯系,并愿意為中國的超算中心和高性能嵌入式應用提供支持。”

(作者:北京華興萬邦管理咨詢有限公司分析師陳皓)

 

網友評論:已有2條評論 點擊查看
登錄 (請登錄發言,并遵守相關規定)
如果您對新聞頻道有任何意見或建議,請到交流平臺反饋。【反饋意見】
關于我們 | 聯系我們 | 本站動態 | 廣告服務 | 歡迎投稿 | 友情鏈接 | 法律聲明
Copyright (c) 2008-2025 01ea.com.All rights reserved.
電子應用網 京ICP備12009123號-2 京公網安備110105003345號