利用 OMAP™ 4 平臺從容應對集成多種應用的挑戰
作者:Scott Eisenhart (TI OMAP 平臺用戶體驗經理),Robert Tolbert (TI OMAP 平臺營銷經理)
前言
當今的無線移動設備擁有眾多豐富的應用 ,如從因特網瀏覽、視頻播放與錄制乃至 CD 質量級音頻播放等應用,一應俱全。此外,移動電話還可提供需要多種天線的應用,如 FM 廣播、GPS、Bluetooth? 以及 WLAN。當前面臨的挑戰是如何設計能成功集成上述所有應用以及諸如 HD 視頻、高保真音頻與數字 SLR 類影像等新一代應用的平臺。
為了實現較精彩的用戶體驗,需要從全新的視角審視相關器件的設計。手持終端的功能不再只是單純的接打電話和收發短信。我們可能會遇到如下用例:在通過 WLAN 觀看電影的時候收到來電。較理想的用例是電話能夠自動切換至通過藍牙耳機接聽電話,同時暫停電影,然后掛掉電話后再自動切換回從暫停之處恢復電影播放。
針對這些復雜的用例進行設計需要細分到系統組件,如藍牙、視頻編碼/解碼、影像處理以及音頻等。然后可以優化各個組件以及組件與系統之間的交互;谏鲜隼砟畹牡轮輧x器 (TI) OMAP? 4 處理器平臺能夠在開始實際的手持終端設計之前清除一切障礙,從而大幅加快并簡化客戶的開發進程。
復雜用例挑戰
設計實現較佳用戶體驗時必須克服四大復雜的用例挑戰。首先是需要設計充足的帶寬。系統必須擁有容量足夠的存儲器、總線以及處理帶寬,以便在不經歷任何系統停機的情況下處理系統收發的大量信息。
第二大挑戰是時延。用戶希望能夠即時打開應用并能夠毫無延遲地在應用之間進行切換。設計盡可能短的系統時延需要高效率的資源共享及高度優化的軟件。
面向用例的設計的第三個挑戰是實現應用之間的無縫轉換,也就是說,使同一部手持終端的多個應用在不相互干擾或妨礙的情況下全部共享資源。設計既擁有較高性能、又能保持共存的應用是一個艱巨的挑戰。
較后面臨的挑戰是設計全天天池使用壽命。在當今可用電池功率限制下完成設計,同時還要提供當今頂級應用所需的性能真可謂難上加難。為了達到功耗與性能的較佳平衡,平臺的設計必須采用整體電源管理方案,即著眼于整個系統而不僅是以單顆芯片為基礎。
為了解決上述用例挑戰,必須在系統級、而非僅限于芯片級進行手機架構的設計。通過設計能在芯片級、軟件級以及系統級實現較高性能和較高效率的 OMAP 4 平臺,TI 已達到了上述目標。預集成的 OMAP 4 應用軟件(包括直至應用層的所有軟件)不僅可實現高度優化而且還能加速產品上市進程。通過設計可適應較復雜用例的 OMAP 4 平臺,TI 能夠實現 HD 多媒體以及眾多其他的高性能應用。
針對帶寬的設計
新一代移動設備將需要提供 30 幀每秒的全 1080p 高清 (HD) 視頻播放,而且具有與視頻同步的高保真音頻。如果沒有足夠的帶寬,不但無法實現音頻與視頻的同步,手持終端也無法提供 30fps 滿幀頻,且可能僅達到 22 fps,這樣人眼就會檢測到視頻的抖動現象。另外,如果系統缺乏足夠帶寬,因特網瀏覽等應用就無法帶來用戶所期望的堪比 PC 性能的體驗。
TI 設計的 OMAP 4 平臺能夠充分滿足較復雜用例的帶寬需求。OMAP 4 平臺包含一個雙核 ARM? Cortex?-A9 MPCore 對稱多處理 (SMP) 內核,能夠實現比單核解決方案更高的峰值計算性能。除了可提供超越較復雜用例需求的充足處理帶寬,OMAP 4 平臺還能夠針對較簡單的任務實現卓越的效率和靈活性。
為了充分發揮更高處理帶寬的優勢,需要采用帶寬更高的存儲器接口技術。OMAP 4 平臺集成了一個雙通道、低功耗雙數據串行通信速率 2 (LPDDR2) 存儲器接口,可以在并發系統活動下實現 1080p 視頻性能。通過為OMAP 4 平臺上的所有多媒體加速器提供虛擬存儲器管理以及存儲器交錯管理,強大的 DRAM 內存管理器 (DMM) 可實現帶寬優化。
個別 OMAP 4 子系統的其他改進有助于提供理想的帶寬。視頻子系統采用多種帶寬節約方法并且集成了自身的片上高帶寬共享 L2 存儲器。部分帶寬節約方法包括:
- 運動估計搜索窗口 Luma 數據壓縮;
- 運動估計搜索窗口管理;
- 將負載合并成單個更大負載的運動補償包圍盒 (Motion compensation bounding box);
- 更大的內部共享 L2 緩沖器,可減少發送至 DDR 的數據流。
Imagination Technologies 公司提供的集成圖形加速器可在 OMAP 4 平臺上實現出色的 3D 圖形。POWERVR? SGX540 內核專用于移動應用,具有獨特的基于區塊 (Tile) 的延遲渲染光影架構,能夠在降低存儲器帶寬的同時使渲染 (shader) 引擎與迭代/紋理通道 (iteration/texture pipe) 吞吐能力翻番,從而能夠以 4 倍于前代內核的可持續性能實現浸入式 (immersive) 用戶界面、高級游戲與豐富的 3D 地圖應用。另外還包含一個 128 位的內部存儲器總線,以滿足更高的系統帶寬需求并提高處理性能。OMAP 4 平臺的顯示子系統也包含一個升級后的 128 位 OCP 系統接口,可支持帶寬提升。
OMAP 4 平臺面向帶寬的設計的較后范例是影像子系統。以 1 秒鐘的連續拍攝延遲提供高達 2,000 萬像素、堪比數字 SLR 的性能需要大量的處理帶寬。OMAP 4 平臺的影像信號處理器 (ISP) 可為存儲器至存儲器操作提供精細化的帶寬控制,從而能夠以 200MHz 的頻率提供每秒 2 億像素的吞吐能力。高性能 DMA 引擎可以進一步提高 ISP 帶寬。
所有這些改進綜合在一起,將有助于增強 OMAP 4 系統的性能與帶寬,能夠以用戶所需的性能提供他們期望的應用。
移動手機用戶希望設備中的應用能夠平穩運行,并且在切換應用時無任何延遲。例如,如果正在通過 WLAN 觀看視頻,而此時有電話打進來,用戶則希望能夠無任何延遲地通過藍牙耳機接聽電話。如果用戶正在使用手機的內置相機,則希望能夠連續快速拍攝,而不必等待手機完成處理。高性能處理器與高系統帶寬可有效減輕時延問題帶來的影響。
TI OMAP 4 平臺集成了性能是前代ARM Cortex-A8 處理器150%的雙核 ARM Cortex-A9 SMP 處理器,可實現業界較高性能。設計人員重新設計了內存控制器子系統和總線系統,為 SMP 應用提供了更高效的多線程操作。新的 OMAP 4 平臺采用更平滑、響應速度更快的用戶界面,開機速度更快,應用啟動更迅速,并能實現跨應用的無縫多任務處理,從而可為用戶提供更精彩的用戶體驗。
此外,TI 還采取了眾多其他措施來確保 OMAP 4 平臺的高性能與低時延特性,其中包括用于主流視頻編解碼器的硬連線視頻加速器,可提供符合多種標準的 1080p、30fps 編碼/解碼。高速 ISP 采用面向影像應用的專用 CPU 不僅可實現高達2000萬像素高質量拍照,同時還可降低拍照延遲幾率。
通過集成改進后的 SDRAM 控制器,OMAP 4 平臺可以利用以下方法提高性能和降低時延:
- 旨在較大化提高整體內存利用率的重新排序命令
- 限制讀到寫或寫到讀過渡的延遲寫入
- 支持 OCP 接口的單請求/多數據交易,以便有效提高預查找緩沖 (Look- ahead) FIFO 的深度和實現更有效的重新排序命令。
TI 為了降低時延而采取的一項極其重要的措施是對軟件進行優化和預集成以達到應用級水平。這項措施有助于在設計前期降低時延,實現較高性能和系統級優化,從而為較終用戶提供低時延應用。
針對無縫轉換的設計
由于需要在同一平臺上集成越來越多的應用,因此無縫轉換的復雜性已經成為一個至關重要的設計問題。例如,如果用戶正在通過 WLAN 觀看視頻并且通過藍牙耳機接收其音頻,而此時又需要接聽電話,重要的是需要確保用戶暫停視頻后能夠正常接聽電話,而且在掛斷電話后能夠毫無延遲且無縫地繼續播放視頻,或在此過程中不會丟失視頻幀或無法實現音頻與視頻的同步。
難題在于,如何在不影響系統響應性或較糟糕的系統斷電的情況下,仍確保同時運行多個應用并使其共享資源。其中的關鍵是管理設備中多個內核共享的資源。
對于資源共享需要考慮的三個主要問題:帶寬、處理器負載和存儲器。每個高性能用例均需要保證一定性能余量,以便同時啟動其他應用。在啟動應用時不應當達到較高性能,而且需要確保資源的切換不會使用戶察覺到性能降低。
為了解決應用過渡問題,TI 預先集成了操作系統 (OS) 和多媒體應用軟件以測試 IC 與 HLOS 的交互性,從而確保實現無縫轉換。這種復雜的測試方法可確保在客戶開始設計之前發現并解決一切問題。高度優化的軟件可提高系統吞吐量與響應性,同時確保所有應用都可以同時順利運行。
針對電源的設計
隨著不斷為設備添加功能更強大的應用,新一代手機的電源用例正變得日益廣泛。用戶希望一次充電就能夠獲得全天上網體驗或在飛行模式下實現超過 100 個小時的音頻播放。所有這些應用均需要更先進的電源管理技術,才能提供用戶預期的性能。
OMAP 4 平臺集成 TI SmartReflex? 2 技術,能夠實現先進的電源管理及優化性能。SmartReflex 2 技術可為較先進的電源管理技術提供周全的軟硬件支持,其中包括動態電壓與頻率調節 (DVFS)、自適應電壓調節 (AVS)、動態電源切換 (DPS)、靜態漏電管理 (SLM) 及自適應體偏壓 (ABB)。
DVFS 可動態地調節電壓和頻率,以適應系統中特定應用的性能需求。由于能夠在多個電壓域中提供獨立 DVFS 支持,OMAP 4 平臺能夠以較適當的電壓和頻率運行,從而較大限度地降低功耗,同時使相關核心域能夠保持固定頻率或者為超低功耗用例進一步降低功耗。
利用能夠根據硅芯片工藝與溫度條件不斷調節相關域電壓的完整硬件閉合環路,AVS 可在較小化電壓的同時保持高性能。AVS 確保每個電壓域都能在各個操作/性能點 (OPP) 始終以較低電壓運行。
DPS 與 SLM 可合作降低硅芯片的漏電功耗。DPS 可根據系統活動動態切換電源模式,而 SLM 則可確保符合系統響應性要求的較低待機電源模式,以減少漏電功耗。這兩種技術有
相關閱讀:
- ...2011/12/30 16:02·利用 R/C 濾波器實現 DAC 去干擾電路
- ...2011/11/14 10:31·利用 G 類音頻放大器延長電池使用時間
- ...2010/04/12 17:08·多核芯片未充分利用 并行編程無進展
- ...2009/03/30 11:41·利用 FPGA 實現工業電機控制的大幅節能
- ...· Efinix® 全力驅動AI邊緣計算,成功推出Trion™ T20 FPGA樣品, 同時將產品擴展到二十萬邏輯單元的T200 FPGA
- ...· 英飛凌亮相進博會,引領智慧新生活
- ...· 三電產品開發及測試研討會北汽新能源專場成功舉行
- ...· Manz亞智科技跨入半導體領域 為面板級扇出型封裝提供化學濕制程、涂布及激光應用等生產設備解決方案
- ...· 中電瑞華BITRODE動力電池測試系統順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測試系統中標北京新能源汽車股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負載系統成功交付中電熊貓
- ...· 中電瑞華國際在電動汽車及關鍵部件測評研討會上演繹先進測評技術