南方財經(jīng)全媒體記者林典馳 深圳報道 人生是場長跑,制勝的關鍵不是瞬間的爆發(fā)力,而是整場比賽的平均速度。AI(人工智能)芯片同理,考驗一款AI芯片的優(yōu)良不僅僅是峰值算力,還有長時間工作下的實測性能。
隨著AI日益成熟,數(shù)字化正深入各個領域。AI產(chǎn)業(yè)鏈包括三層,其中最底層也是最基礎的就是以芯片等硬件為AI提供數(shù)據(jù)及算力支撐的基礎層。
鯤云科技便是國內(nèi)諸多AI芯片設計廠商中一顆冉冉升起的新星,自成立之初專注AI芯片的研發(fā)設計。鯤云科技以數(shù)據(jù)流技術為核心,提供高性能、低延時、高算力性價比的下一代人工智能計算平臺。
6月,鯤云科技憑借CAISA芯片,獲得了中國智能科技技術最高獎——吳文俊人工智能專項獎芯片項目一等獎。
鯤云科技聯(lián)合創(chuàng)始人兼首席技術官蔡權雄在接受南方財經(jīng)全媒體記者采訪時表示,隨著摩爾定律逼近物理極限,單純依靠制程提高芯片性能愈發(fā)困難,鯤云的核心技術是采用定制的數(shù)據(jù)流架構,該架構可以不依賴指令集加速人工智能計算。鯤云科技可基于現(xiàn)有的成熟制程,通過架構創(chuàng)新,提高芯片的使用率,從而大幅降低用戶使用人工智能的成本。
在2015年牛昕宇參加學術論壇后,臺下一位天使投資人對其發(fā)出創(chuàng)業(yè)邀請。彼時他師從數(shù)據(jù)流架構的開創(chuàng)鼻祖陸永青院士,是英國帝國理工學院的全獎博士和實驗室負責人。
那年第一代AI芯片開始爆發(fā),傳統(tǒng)芯片廠商、算法公司、互聯(lián)網(wǎng)巨頭魚貫而入。牛昕宇開始有點猶豫,但在陸永青院士的支持下,2016年他毅然回國創(chuàng)立了鯤云科技。后來,牛昕宇又向師兄蔡權雄拋出橄欖枝,邀請他出任鯤云科技CTO,并從帝國理工學院挖掘了一批創(chuàng)業(yè)伙伴。
蔡權雄表示,創(chuàng)業(yè)初期最大難點是對AI芯片市場需求的判斷,這將其決定技術路線的迭代方向;這才有前期產(chǎn)品一邊同客戶推廣,一邊觀察市場需求反復打磨的經(jīng)歷。
“做AI芯片有兩個方向。一個是基于傳統(tǒng)的指令集架構,這條路相對容易,但是在芯片利用率上很難拉開差距。例如國外的AI芯片在算力和制程每一個指標都非常領先,加上國外專利的壟斷性,在這種情況下,我們在這條路上想要突出重圍,是非常難的。”牛昕宇表示。
鯤云科技基于30余年的技術基礎,瞄準數(shù)據(jù)流架構獨立研發(fā)。早在求學期間,牛昕宇就已經(jīng)將數(shù)據(jù)流底層技術作為主要的研發(fā)方向,并致力于推進數(shù)據(jù)流架構和各個特定應用領域的融合,比如金融、機器學習、物理仿真等。
經(jīng)過三年打磨,2020年鯤云發(fā)布全球首款數(shù)據(jù)流AI芯片CAISA,搭載了四個CAISA3.0引擎,峰值性能可達10.9TOPs,經(jīng)第三方檢測,該芯片可實現(xiàn)最高95.4%的芯片利用率,并已實現(xiàn)量產(chǎn)。
與X86架構、ARM架構等指令集架構不同,數(shù)據(jù)流架構的顯著特點就是依托數(shù)據(jù)流的流動次序控制計算執(zhí)行次序,而非指令執(zhí)行次序,使用粗粒度表示來提高數(shù)據(jù)的并行度,并允許編譯器同時調(diào)度多個順序循環(huán)和功能,以實現(xiàn)更高的吞吐量和更低的延遲。
數(shù)據(jù)流架構的意義在于突破了傳統(tǒng)芯片架構對芯片利用率的束縛,最大化發(fā)揮芯片的峰值性能,蔡權雄表示,“我們的紙面標稱性能可能不及同類競品,但是我們實際使用效率或?qū)嶋H算力比肩同類競品,價格上還有一定的優(yōu)勢?!?/span>
對于定制類架構,市面上有聲音認為通用性不足,牛昕宇表示,這恰恰是數(shù)據(jù)流能解決的問題,CAISA定制數(shù)據(jù)流架構是一個針對深度學習領域的通用架構,CAISA架構底層算子可配置支持不同計算方式,支持不同算子組合和拓展,不同框架和開發(fā)方式可通過端到端的編譯器RainBuilder來支持實現(xiàn)。
目前,鯤云研發(fā)的CAISA芯片及加速卡產(chǎn)品等已在多個領域?qū)崿F(xiàn)商用。鯤云科技為智慧安監(jiān)、智慧油田、智慧化工等領域提供包括邊緣計算的整體解決方案。
所謂邊緣計算有一個著名“章魚論”。章魚捕獵靈巧迅速,腕足之間配合嫻熟,這是因為章魚神經(jīng)元只有40%在腦部,剩下60%分布在章魚的八條觸角上,以觸角替代大腦思考,就近解決問題和快速反應,章魚這種信息處理方式就相當于“邊緣計算”。
隨著技術的發(fā)展,人們越來越需要在“腕足”的邊緣,實現(xiàn)計算和決策?!霸谶@些場景中,‘降本增效’是核心需求”,蔡權雄表示。
例如在化工場景中,傳統(tǒng)的安防監(jiān)控系統(tǒng)已經(jīng)比較成熟,攝像頭監(jiān)控系統(tǒng)基本部署完成,但視頻結構化利用率較低,單純依靠人工巡檢不現(xiàn)實。
據(jù)介紹,鯤云科技采用邊緣計算,對現(xiàn)場接入的百余路視頻進行視頻處理,實現(xiàn)全廠區(qū)24小時實時監(jiān)控,及時發(fā)現(xiàn)火情、安全防護著裝違規(guī)、作業(yè)場所違規(guī)操作等風險事件并報警,幫助安全管理中心及時做出反應。憑借CAISA芯片的高算力性價比,智慧安監(jiān)在提升感知效率的同時,也能降低用戶的使用成本,現(xiàn)已在國內(nèi)超1000個項目中使用。
蔡權雄表示,許多邊緣端場景還存在“碎片化”需求,因此廠商除了考慮提升芯片利用率,做到更高算力性價比之外,還需要思考如何提升通用性、軟件易用性等。
除此之外,為面向高性能AI推理市場,鯤云推出星空加速卡X3,現(xiàn)已與多個龍頭企業(yè)完成產(chǎn)品適配,落地在邊緣端。
蔡權雄表示,數(shù)據(jù)更注重構建先進的AI算力基礎設施,一方面,算力基礎設施更新?lián)Q代會降低數(shù)據(jù)的傳輸成本,導致更多的數(shù)據(jù)被收集,產(chǎn)生更大的算力需求;另一方面,算力密度越來越高,系統(tǒng)性能越來越強,部署成本越來越可控。
在他看來,邊緣和云會有共存的關系,邊緣側主要進行實時處理,數(shù)據(jù)匯集后進行更深入的分析,二者都在快速增長中,且都有廣闊的市場前景。
在首款數(shù)據(jù)流AI芯片實現(xiàn)量產(chǎn)并大規(guī)模商用后,鯤云科技并未停下腳步。據(jù)蔡權雄透露,明年鯤云科技將會推出第二代CAISA芯片,采用先進制程,采用CAISA4.0架構,最大特點是實現(xiàn)單芯片上解決所有AI的相關運算。
本文轉載自:https://www.sfccn.com/2022/11-7/zOMDE0NzNfMTc3NDczOA.html
提供下一代計算平臺 加速人工智能落地
聯(lián)系我們:contact@corerain.com
銷售聯(lián)絡:sales@corerain.com
媒體合作:media@corerain.com
展會合作:events@corerain.com
深圳 | 深圳市福田保稅區(qū)市花路長富金茂大廈14層(總部)
倫敦 | Kemp House,152-160 City Road, London, EC1V 2NX
上海 | 上海市閔行區(qū)龍湖虹橋天街A棟608A
濟南 | 山東省濟南市濟南市高新區(qū)旅游路8661號高科技創(chuàng)新園 5 號樓 9 層
西安 | 陜西省西安市碑林區(qū)大差市十字西南角1幢1單元10503室 (萬達新天地)
廣州 | 廣東省廣州市番禺區(qū)鐘村街鐘二村鐘漢路13號星光薈直播小鎮(zhèn)508A
杭州 | 杭州市江干區(qū)錢江新城城星路98號迪凱城星國際A座27樓