你的位置:首頁 > 電路保護 > 正文

借助自適應(yīng)模塊化系統(tǒng) (SOM)加速邊緣創(chuàng)新

發(fā)布時間:2021-07-26 責(zé)任編輯:lina

【導(dǎo)讀】由 AI 提供支持的應(yīng)用,正在日益普遍地被部署到邊緣和終端,高性能 AI 推斷正在推動更智慧的城市和高度自動化的智能工廠步入現(xiàn)實。隨著智能零售引入了極為精致的自動化購物體驗,零售體驗也變得更加精巧細膩。這些應(yīng)用需要具備極高可靠性并提供高性能,同時也需要提供高效緊湊的外形尺寸。
 
由 AI 提供支持的應(yīng)用,正在日益普遍地被部署到邊緣和終端,高性能 AI 推斷正在推動更智慧的城市和高度自動化的智能工廠步入現(xiàn)實。隨著智能零售引入了極為精致的自動化購物體驗,零售體驗也變得更加精巧細膩。這些應(yīng)用需要具備極高可靠性并提供高性能,同時也需要提供高效緊湊的外形尺寸。
 
邊緣處理難題
 
在邊緣部署系統(tǒng)時,功耗、占板面積和成本都是制約因素。在邊緣處理的種種限制條件下,處理需求的不斷提高,意味著提供所需的性能水平將面臨更大的挑戰(zhàn)。雖然 CPU 在邊緣計算上也有發(fā)展,但近年來的增長速度有所放緩。在為新一代AI 支持的邊緣應(yīng)用交付所需性能時,未加速的 CPU 表現(xiàn)得相當勉強,特別是考慮到嚴格的時延要求。
 
當在邊緣上實現(xiàn)前沿 AI 應(yīng)用時,領(lǐng)域?qū)S眉軜?gòu) (DSA) 是關(guān)鍵。此外,DSA 還提供確定性和低時延。
 
合適的 DSA 專門設(shè)計用于高效處理所需數(shù)據(jù),既有 AI 推斷,也有非 AI 部分的應(yīng)用,也就是整體應(yīng)用的加速??紤]到 AI 推斷需要非 AI 的預(yù)處理和后處理,這些都需要更高的性能,這一點很重要。從根本上說,要在邊緣上(和其他地方)實現(xiàn)由 AI 提供支持的高效應(yīng)用,需要整體應(yīng)用的加速。
 
如同任何固定功能的芯片解決方案一樣,為 AI 邊緣應(yīng)用開發(fā)的應(yīng)用專用標準產(chǎn)品 (ASSP) 仍有自己的局限性。主要挑戰(zhàn)在于 AI 創(chuàng)新的速度異乎尋常。與非 AI 技術(shù)相比,AI模型的過時速度會快得多。使用固定功能的芯片器件實現(xiàn) AI,會因更新型、更高效AI 模型的出現(xiàn)而迅速過時。固定功能芯片器件的流片需要花費數(shù)年時間,到那時 AI 模型的前沿技術(shù)將已經(jīng)向前發(fā)展。此外,對于邊緣應(yīng)用,安全和功能安全要求的重要性也在提高,可能經(jīng)常需要成本高昂的現(xiàn)場更新。
 
自適應(yīng)計算的前景
 
自適應(yīng)計算包含能夠針對具體應(yīng)用進行優(yōu)化的硬件,例如現(xiàn)場可編程門陣列 (FPGA),它是一個功能強大的解決方案,專門用于基于AI 的邊緣應(yīng)用。
 
此外,新的自適應(yīng)硬件也層出不窮,包括含有 FPGA 架構(gòu)并與一個或多個嵌入式 CPU 子系統(tǒng)耦合的自適應(yīng)片上系統(tǒng) (SoC)。然而自適應(yīng)計算遠不止“純硬件”。它整合了一套綜合而全面的設(shè)計軟件和運行時軟件。將它們結(jié)合起來,就形成了一種獨特的自適應(yīng)平臺,可在其上構(gòu)建非常靈活高效的系統(tǒng)。
 
用自適應(yīng)計算實現(xiàn) DSA,可避免使用 ASIC 等定制芯片器件所需的設(shè)計時間和前期成本。這樣就能為任何特定領(lǐng)域應(yīng)用,包括基于 AI的邊緣應(yīng)用,迅速部署經(jīng)過優(yōu)化的靈活的解決方案。自適應(yīng)SoC 是此類領(lǐng)域?qū)S锰幚淼睦硐脒x擇,因為它們既擁有綜合全面的嵌入式CPU 子系統(tǒng)的靈活性,又具備自適應(yīng)硬件的優(yōu)異的數(shù)據(jù)處理能力。
 
推出自適應(yīng)模塊化系統(tǒng) — SOM
 
模塊化系統(tǒng) (SOM) 提供完整的、可量產(chǎn)的計算平臺。與從芯片級從頭開發(fā) (chip-down development)相比,這種方法能節(jié)省可觀的開發(fā)時間與成本。SOM 能夠插入到較大的邊緣應(yīng)用系統(tǒng)內(nèi),從而既可以提供定制實現(xiàn)方案的靈活性,又可以提供現(xiàn)成解決方案的易用性和更快的上市速度。這些優(yōu)勢讓  SOM  成為邊緣  AI  應(yīng)用的理想平臺。然而,要實現(xiàn)現(xiàn)代化AI 應(yīng)用所需的性能,加速必不可少。
 
某些應(yīng)用需要定制硬件組件與自適應(yīng) SoC 接口連接,意味著需要從芯片級從頭設(shè)計 (Chip-down design)。然而,越來越多基于 AI 的邊緣應(yīng)用,需要相似的硬件組件和接口,甚至在終端應(yīng)用迥異的時候也是如此。隨著企業(yè)轉(zhuǎn)向標準化接口和通信協(xié)議,盡管處理需求顯著不同,但同一套組件可適用于各種類型的應(yīng)用。
 
面向基于 AI 的邊緣應(yīng)用的自適應(yīng) SOM, 結(jié)合了自適應(yīng) SoC與行業(yè)標準接口和組件,使得硬件經(jīng)驗有限甚至沒有硬件經(jīng)驗的開發(fā)者也可以獲益于自適應(yīng)計算技術(shù)。自適應(yīng)SoC 既能實現(xiàn) AI 處理,也能實現(xiàn)非 AI 處理,也就是說其可以滿足整體應(yīng)用的處理需求。
 
此外,自適應(yīng) SOM 上的自適應(yīng) SoC 支持高度的定制化。它的設(shè)計目的,是集成到更大型的系統(tǒng)內(nèi)并使用預(yù)定義的外形尺寸。使用自適應(yīng) SOM,可以全面發(fā)揮自適應(yīng)計算的優(yōu)勢,同時避免了從芯片級從頭開始的芯片設(shè)計。自適應(yīng) SOM 只是解決方案的一個部分。軟件也是關(guān)鍵。
 
采用自適應(yīng) SOM 的企業(yè),能廣泛受益于性能、靈活性和快速開發(fā)時間的獨特組合。無需構(gòu)建自己的電路板,他們就能夠享受自適應(yīng)計算提供的各種優(yōu)勢 — 這個優(yōu)勢,最近才隨著賽靈思Kria™自適應(yīng) SOM 產(chǎn)品組合的推出在邊緣得以實現(xiàn)。
 
借助自適應(yīng)模塊化系統(tǒng) (SOM)加速邊緣創(chuàng)新
Kria K26 SOM
 
Kria K26 SOM 構(gòu)建在 Zynq® UltraScale+™ MPSoC 架構(gòu)頂端,搭載四核 Arm® Cortex™-A53  處理器,超過25萬個邏輯單元和一個 H.264/265 視頻編解碼器。此外,該 SOM 還搭載4GB的DDR4存儲器、69  個 3.3V I/O 和 116 個 1.8V I/O,使之能夠適配幾乎任何處理器或接口。憑借1.4TOPS的AI算力,與基于 GPU 的 SOM 相比,Kria K26 SOM 助力開發(fā)者開發(fā)出時延和功耗更低,性能高 3 倍的視覺 AI 應(yīng)用。這對安保、交通與市政攝像頭、零售分析、機器視覺和視覺引導(dǎo)機器人等智能視覺應(yīng)用,可謂是重大福音。通過標準化系統(tǒng)核心部分,開發(fā)者擁有更多時間專心開發(fā)自己的專屬特性,從而在市場競爭中實現(xiàn)技術(shù)差異化。
 
與軟件可以更新但受到固定加速器限制的其他邊緣 AI 產(chǎn)品不同,Kria SOM 在兩個方面提供靈活性,即軟件和硬件都能在今后更新。用戶能夠適配 I/O 接口、視覺處理和 AI 加速器,為以下的部分或全部應(yīng)用提供支持:MIPI、LVDS 和SLVS-EC 接口;適用于日間或夜間的高質(zhì)量專用高動態(tài)范圍成像算法;8 位深度學(xué)習(xí)處理單元;或未來的 4 位甚至是 2 位深度神經(jīng)網(wǎng)絡(luò)方法。多模傳感器融合與實時 AI 處理的結(jié)合,如今已經(jīng)非常容易實現(xiàn),可以從賽靈思 KV260 視覺 AI 入門套件開始設(shè)計,通過 Kria K26 SOM 部署到生產(chǎn)中。
 
借助自適應(yīng)模塊化系統(tǒng) (SOM)加速邊緣創(chuàng)新
Kria KV260 視覺 AI 入門套件
 
面向軟硬件開發(fā)者提供的優(yōu)勢
 
自適應(yīng) SOM 同時讓硬件開發(fā)者和軟件開發(fā)者受益。對于硬件開發(fā)者,自適應(yīng) SOM 提供了現(xiàn)成的、可量產(chǎn)的解決方案,從而節(jié)省了大量的開發(fā)成本與開發(fā)時間。此外,這些器件也允許硬件團隊在流程后期變更設(shè)計,而基于固定功能芯片技術(shù)的 SOM 則無法實現(xiàn)。
 
對于 AI 開發(fā)者和軟件開發(fā)者來說,自適應(yīng)計算比過去更容易應(yīng)用。賽靈思為確保自適應(yīng)計算的易用性,對工具流進行了大量投資。通過將軟硬件平臺與可量產(chǎn)的視覺加速應(yīng)用相結(jié)合,Kria SOM 產(chǎn)品組合的推出將這種易用性提升到全新水平。這些交鑰匙應(yīng)用取消了所有 FPGA 硬件設(shè)計工作,只需要軟件開發(fā)者集成他們的定制 AI 模型、應(yīng)用代碼并有選擇地修改視覺流水線。在 Vitis™ 統(tǒng)一軟件開發(fā)平臺和庫支持下,他們可以使用熟悉的設(shè)計環(huán)境,如 TensorFlow、Pytorch 或 Caffe 框架以及 C、C++、OpenCL™ 和 Python 編程語言。
 
通過這種面向軟件設(shè)計的新的加速應(yīng)用范式,賽靈思還面向邊緣應(yīng)用推出了首個嵌入式應(yīng)用商店,為客戶提供來自賽靈思及其生態(tài)系統(tǒng)合作伙伴的豐富多樣的 Kria SOM 應(yīng)用選擇。賽靈思解決方案屬于免費提供的開源加速應(yīng)用,包含智能攝像頭、人臉檢測、帶有智能視覺輔助的自然語言處理等多種應(yīng)用。
 
靈活應(yīng)變的未來
 
AI 模型將繼續(xù)以高速步伐向前演進發(fā)展。這意味著加速平臺必須能夠靈活應(yīng)變,才能在現(xiàn)在和未來以最佳方式實現(xiàn) AI 技術(shù)。實際上,SOM 提供了理想的邊緣處理平臺。與自適應(yīng) SoC 相結(jié)合,SOM 為由 AI 提供支持的應(yīng)用,提供了綜合全面、可量產(chǎn)的平臺。采用這類器件的企業(yè)能廣泛受益于性能、靈活性和快速開發(fā)時間的獨特組合,并從自適應(yīng)計算種收獲豐厚的回報。
(來源:賽靈思,作者:Evan Leal,電路板與套件產(chǎn)品營銷總監(jiān) )
 
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請電話或者郵箱聯(lián)系小編進行侵刪。
 
 
推薦閱讀:
用于智能標簽的運動感知薄型低功耗藍牙信標解決方案
如何實現(xiàn)模擬電源的數(shù)字管理?
4D成像雷達軟硬兼施,性能變本加厲
威剛工控領(lǐng)先推出112層BiCS5 3D NAND固態(tài)硬盤
LED恒流vs恒壓驅(qū)動器:從性能到應(yīng)用,一文講清楚!
要采購套件么,點這里了解一下價格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉