Jim Keller再掀芯片風(fēng)暴!Tenstorrent全棧布局,能否顛覆RISC-V格局?
長(zhǎng)期以來(lái),RISC-V架構(gòu)雖憑借開(kāi)源開(kāi)放的特性受到廣泛關(guān)注,但在高性能計(jì)算領(lǐng)域始終缺乏具有標(biāo)桿意義的產(chǎn)品,這導(dǎo)致其在數(shù)據(jù)中心、汽車等高價(jià)值場(chǎng)景中的滲透受到限制。
然而在日前舉辦的Tenstorrent TT Blueprint China技術(shù)峰會(huì)上,隨著Tenstorrent旗下高性能RISC-V CPU IP Ascalon™,以及Atlantis開(kāi)發(fā)平臺(tái)、Alexandria汽車解決方案等一系列重要產(chǎn)品的發(fā)布,RISC-V迎來(lái)了從邊緣探索階段邁向主流應(yīng)用的關(guān)鍵轉(zhuǎn)折。
全棧能力構(gòu)建落地基礎(chǔ)?
Tenstorrent公司由芯片設(shè)計(jì)領(lǐng)域傳奇人物,被業(yè)界尊稱為“硅仙人”的Jim Keller擔(dān)任CEO,其團(tuán)隊(duì)匯聚了多位來(lái)自AMD、Intel、Apple等企業(yè)的頂尖研發(fā)人才,在高性能CPU架構(gòu)設(shè)計(jì)、全棧工具鏈開(kāi)發(fā)方面實(shí)現(xiàn)了突破性創(chuàng)新。?
聚焦RISC-V產(chǎn)品落地與IP授權(quán)是Tenstorrent的核心業(yè)務(wù)。公司目前已有多款產(chǎn)品正式發(fā)售,包括高端Galaxy AI服務(wù)器、適配辦公場(chǎng)景的水冷式QuietBox™小型服務(wù)器、機(jī)架式風(fēng)冷LoudBox™開(kāi)發(fā)服務(wù)器及PCIe卡。在IP授權(quán)領(lǐng)域,Tensix™ AI處理器和Ascalon CPU IP正在對(duì)外授權(quán),且計(jì)劃明年推出新IP的重大升級(jí),進(jìn)一步豐富產(chǎn)品與授權(quán)體系。
“Tenstorrent有一個(gè)簡(jiǎn)單的使命:大幅降低人工智能和硅片成本。為此,我們采用了一些共享技術(shù),并在此基礎(chǔ)上構(gòu)建了全棧開(kāi)發(fā)能力,可根據(jù)客戶需求提供全棧銷售或授權(quán)服務(wù)。“Jim說(shuō)。
這里所指的“全棧能力”,是指涵蓋從IP到芯片,再到云軟件、服務(wù)器的完整解決方案。具體而言,一方面,通過(guò)共享AI開(kāi)源軟件堆棧,深耕RISC-V編譯器工具鏈,開(kāi)發(fā)并開(kāi)放大量RISC-V CPU及AI處理器配套IP;另一方面,開(kāi)源AI編譯器棧(含模型、編譯器、算子庫(kù)等)及處理器架構(gòu)參考,內(nèi)部既采用自研處理器(Baby RISC),也兼容Rocket Core等開(kāi)源方案,全方位支持用戶基于其規(guī)范自主開(kāi)發(fā)。
按照J(rèn)im的說(shuō)法,Tenstorrent采用基于常規(guī)的GDDR6/7內(nèi)存及以太網(wǎng)技術(shù)構(gòu)建計(jì)算機(jī)系統(tǒng),以降低系統(tǒng)門(mén)檻。下一代AI產(chǎn)品方案將聚焦芯粒技術(shù),通過(guò)將大塊單片芯片拆分為更小模塊,實(shí)現(xiàn)芯片易制造、易升級(jí)的特性,長(zhǎng)期將顯著降低AI解決方案的構(gòu)建與迭代成本。
授權(quán)模式上,Tenstorrent推出創(chuàng)新許可機(jī)制,允許客戶獲取IP后進(jìn)行修改與迭代優(yōu)化,助力客戶擺脫供應(yīng)商鎖定,無(wú)需支付高額許可費(fèi)即可基于其架構(gòu)規(guī)范自主開(kāi)發(fā)產(chǎn)品。這一模式既契合開(kāi)源理念,也滿足了客戶打造專屬產(chǎn)品的需求,受到眾多客戶認(rèn)可。
在中國(guó)市場(chǎng)布局方面,Jim表示,“Tenstorrent已實(shí)現(xiàn)合規(guī)運(yùn)營(yíng),Wormhole(AI)、Ascalon(CPU)等核心IP已具備出口合規(guī)資質(zhì),可合法在中國(guó)市場(chǎng)銷售。“與此同時(shí),公司還與Corelab達(dá)成深度合作,借助其在SoC和IP領(lǐng)域的優(yōu)勢(shì)服務(wù)更多中國(guó)本土客戶,并聯(lián)合國(guó)內(nèi)多所高校推進(jìn)相關(guān)合作,全面拓展本土業(yè)務(wù)與生態(tài)布局。
Ascalon填補(bǔ)高性能RISC-V空白
Ascalon™是Tenstorrent面向服務(wù)器、AI基礎(chǔ)設(shè)施、汽車高性能計(jì)算(HPC)及高級(jí)駕駛輔助系統(tǒng)(ADAS)等廣泛應(yīng)用場(chǎng)景提供完整的高性能解決方案,其技術(shù)突破并非單點(diǎn)優(yōu)化,而是基于全棧設(shè)計(jì)理念的系統(tǒng)性創(chuàng)新。用Tenstorrent工程副總裁Divyang Agrawal的話來(lái)說(shuō),就是“性能超越市場(chǎng)上任何現(xiàn)有RISC-V CPU”。
Tenstorrent工程副總裁Divyang Agrawal
官方資料顯示,Ascalon單核性能經(jīng)業(yè)界標(biāo)準(zhǔn)SPEC CPU基準(zhǔn)測(cè)試驗(yàn)證,達(dá)到22 SPECint® 2006/GHz、>2.3 SPECint® 2017/GHz以及>3.6 SPECfp® 2017/GHz。在Samsung SF4X工藝節(jié)點(diǎn)下,可實(shí)現(xiàn)>2.5GHz的主頻,性能與Arm Neoverse N2產(chǎn)品相當(dāng),成為當(dāng)前公開(kāi)數(shù)據(jù)中性能最為強(qiáng)勁的RISC-V CPU IP。?
架構(gòu)層面,Ascalon嚴(yán)格遵循RVA23U64標(biāo)準(zhǔn),集成了高性能RVV1.0矢量引擎。矢量單元支持256位寬操作,單周期內(nèi)可完成8次64位浮點(diǎn)運(yùn)算,極大地提升了AI推理、信號(hào)處理等并行計(jì)算場(chǎng)景的效率。?
從功能層面來(lái)看,Ascalon內(nèi)置硬件虛擬化模塊(支持RVVM規(guī)范)、四級(jí)別內(nèi)存管理單元(MMU)以及高級(jí)中斷架構(gòu)(APLIC/ACLINT)。同時(shí),通過(guò)總線加密、指令流隔離等技術(shù)實(shí)現(xiàn)側(cè)信道攻擊防護(hù),滿足企業(yè)級(jí)應(yīng)用的安全需求。?
在靈活度方面,其核心數(shù)量可從1核擴(kuò)展至8核,L1緩存(32KB-128KB/核)、L2緩存(256KB-8MB)的尺寸可按需配置,甚至可通過(guò)片上網(wǎng)絡(luò)(NoC)擴(kuò)展至多芯片集群,以適配從嵌入式控制器到高性能服務(wù)器等多元場(chǎng)景。?
更為關(guān)鍵的是,Tenstorrent已完成Ascalon在核心工具鏈的上游整合。GCC 13.1、LLVM 16.0已原生支持Ascalon的指令集擴(kuò)展,Qemu 8.0實(shí)現(xiàn)了完整的虛擬化仿真。開(kāi)發(fā)者無(wú)需對(duì)現(xiàn)有代碼進(jìn)行修改,即可完成遷移部署,這一舉措有效解決了RISC-V長(zhǎng)期存在的工具鏈碎片化問(wèn)題。?
此外,Tenstorrent還構(gòu)建了全鏈條的技術(shù)支撐體系。根據(jù)Tenstorrent IP戰(zhàn)略副總裁Aniket Saha的介紹,在系統(tǒng)IP層面,Tenstorrent推出了涵蓋地址轉(zhuǎn)換(TT-IOMMU,支持PCIe設(shè)備DMA隔離)、調(diào)試追蹤(TT-DFD,支持指令流/數(shù)據(jù)流實(shí)時(shí)監(jiān)控)、電源管理(TT-PMK,支持動(dòng)態(tài)電壓頻率調(diào)節(jié))以及片上網(wǎng)絡(luò)(TT-NW,帶寬達(dá)2TB/s)的全系列產(chǎn)品,實(shí)現(xiàn)SoC的即插即用集成。?
Tenstorrent IP戰(zhàn)略副總裁Aniket Saha
而在芯粒生態(tài)層面,Tenstorrent主導(dǎo)Open Chiplet Atlas(OCA)計(jì)劃——通過(guò)“架構(gòu)定義-接口模板-測(cè)試認(rèn)證”的三層體系,將芯粒間互聯(lián)的物理層、協(xié)議層、工具鏈進(jìn)行標(biāo)準(zhǔn)化。
基于Ascalon打造的Alexandria解決方案是Tenstorrent發(fā)布的第一代汽車 IP,通過(guò)雙核心鎖步設(shè)計(jì)、硬件級(jí)故障檢測(cè)單元實(shí)現(xiàn)ISO 26262合規(guī)性,支持ASIL B/D安全等級(jí),能夠滿足ADAS 域控制器(算力需求50-200TOPS)、智能座艙(多屏交互+語(yǔ)音識(shí)別)以及中央計(jì)算(整車數(shù)據(jù)處理)等場(chǎng)景的差異化需求。?
聯(lián)手CoreLab,實(shí)現(xiàn)本土生態(tài)破局?
如前文所述,RISC-V過(guò)去未能實(shí)現(xiàn)大規(guī)模商業(yè)化落地,核心瓶頸在于技術(shù)成熟度與生態(tài)完整性的雙重欠缺。一方面,高性能架構(gòu)的設(shè)計(jì)難度極高,需要長(zhǎng)期的技術(shù)積累和巨額研發(fā)投入;另一方面,開(kāi)源生態(tài)缺乏具有產(chǎn)業(yè)號(hào)召力的主導(dǎo)者,導(dǎo)致軟硬件廠商各自為戰(zhàn),出現(xiàn)“芯片有產(chǎn)品、應(yīng)用無(wú)場(chǎng)景,工具能可用、適配成本高”的碎片化問(wèn)題。?
為此,Tenstorrent選擇與CoreLab進(jìn)行戰(zhàn)略合作,意在實(shí)現(xiàn)技術(shù)與生態(tài)的強(qiáng)強(qiáng)聯(lián)合,被產(chǎn)業(yè)界普遍視為推動(dòng)RISC-V生態(tài)走向成熟的關(guān)鍵因素。
CoreLab是一家聚焦開(kāi)放架構(gòu)高性能AI處理器與RISC-V生態(tài)構(gòu)建的科技創(chuàng)新企業(yè),由Arm中國(guó)前董事長(zhǎng)吳雄昂(Allen Wu)創(chuàng)立,其核心定位是通過(guò)定制化IP設(shè)計(jì)、全棧系統(tǒng)解決方案與開(kāi)源生態(tài)協(xié)作,賦能全球AI與半導(dǎo)體領(lǐng)域的創(chuàng)新者,尤其在RISC-V架構(gòu)商業(yè)化落地與本土生態(tài)培育中扮演關(guān)鍵角色。
CoreLab Technology董事長(zhǎng)吳雄昂
“平臺(tái)型商業(yè)模式是RISC-V產(chǎn)業(yè)發(fā)展的一個(gè)方向,通過(guò)持續(xù)開(kāi)放合作完善平臺(tái),可降低客戶開(kāi)發(fā)門(mén)檻,幫助企業(yè)在高性能細(xì)分市場(chǎng)擺脫同質(zhì)化競(jìng)爭(zhēng)。”吳雄昂強(qiáng)調(diào)說(shuō),CoreLab與Tenstorrent針對(duì)機(jī)器人、邊緣計(jì)算等新興場(chǎng)景聯(lián)合開(kāi)發(fā)的開(kāi)放架構(gòu)計(jì)算平臺(tái)Atlantis,其核心目標(biāo)是“降低創(chuàng)新門(mén)檻,讓本土開(kāi)發(fā)者能夠?qū)⒏嗑ν度氲剿惴▌?chuàng)新上,而非硬件適配。” ?
Atlantis平臺(tái)以Ascalon 8核處理器為核心,配備64GB LPDDR5內(nèi)存(帶寬達(dá)102.4GB/s)、20通道PCIe Gen4 接口(支持設(shè)備直連擴(kuò)展)、雙路HDMI 2.1以及千兆以太網(wǎng)接口。同時(shí),集成了CoreLab自主研發(fā)的IO擴(kuò)展模塊,支持Camera Link、EtherCAT等工業(yè)級(jí)接口。?
為進(jìn)一步完善生態(tài)支撐,CoreLab還推出了針對(duì)AI/機(jī)器人場(chǎng)景的開(kāi)源平臺(tái) OpenCSS(Open Compute Subsystem for Smart Systems)。該平臺(tái)在Atlantis的基礎(chǔ)上,構(gòu)建了“三層生態(tài)體系”:
- 底層為硬件抽象層(HAL),統(tǒng)一了不同廠商的芯片接口、傳感器協(xié)議,實(shí)現(xiàn)“一次開(kāi)發(fā)、多平臺(tái)部署”;
- 中層為算法組件庫(kù),集成了運(yùn)動(dòng)規(guī)劃、環(huán)境感知、人機(jī)交互等核心算法模塊,均經(jīng)過(guò)RISC-V架構(gòu)優(yōu)化;
- 上層為應(yīng)用孵化平臺(tái),提供技術(shù)支持、資源對(duì)接以及市場(chǎng)推廣服務(wù)。?
外界分析認(rèn)為,CoreLab精準(zhǔn)切入AI、機(jī)器人、汽車電子等新興高價(jià)值場(chǎng)景,核心戰(zhàn)略是“技術(shù)協(xié)同+本土賦能”。一方面,與Tenstorrent形成“技術(shù)大佬+生態(tài)大佬”的黃金組合——Tenstorrent憑借Jim Keller團(tuán)隊(duì)的技術(shù)積累,提供高性能RISC-V CPU IP,CoreLab則發(fā)揮本土生態(tài)運(yùn)營(yíng)優(yōu)勢(shì),推動(dòng)技術(shù)落地與場(chǎng)景適配,共同破解 RISC-V“技術(shù)成熟度不足、生態(tài)碎片化”的行業(yè)痛點(diǎn)。
另一方面,這種“技術(shù)輸出+生態(tài)培育”的模式,也有效解決了開(kāi)源架構(gòu)“叫好不叫座”的行業(yè)痛點(diǎn)。正如?希姆計(jì)算公司CEO梅迪所強(qiáng)調(diào)的那樣,在與Tenstorrent、CoreLab Technology達(dá)成三方戰(zhàn)略合作后,三方秉持“超越單一AI芯片,構(gòu)建整合CPU、NPU與網(wǎng)絡(luò)的完整計(jì)算生態(tài)”的統(tǒng)一愿景,將充分發(fā)揮Tenstorrent的高性能 IP、CoreLab Technology的前沿研究實(shí)力,以及希姆計(jì)算的落地部署經(jīng)驗(yàn),通過(guò)開(kāi)放協(xié)作打破技術(shù)壁壘,讓Atlantis平臺(tái)成為開(kāi)發(fā)者構(gòu)建AI原生應(yīng)用的優(yōu)選載體,加速RISC-V生態(tài)在各行業(yè)的滲透。
廣州希姆半導(dǎo)體科技有限公司(希姆計(jì)算)CEO梅迪
以開(kāi)放平臺(tái)重構(gòu)計(jì)算產(chǎn)業(yè)新生態(tài)
"Open Always Wins in the End(最終,開(kāi)放架構(gòu)將獲勝)“,是Jim Keller最著名的觀點(diǎn)之一,它強(qiáng)調(diào)了開(kāi)放架構(gòu)在計(jì)算浪潮中的決定性作用。作為芯片行業(yè)從業(yè)者,吳雄昂也分享了自己對(duì)RISC-V技術(shù)生態(tài)與行業(yè)趨勢(shì)的分析和研判。
他表示,從行業(yè)歷史來(lái)看,每次重大技術(shù)變革都會(huì)催生新型芯片架構(gòu),傳統(tǒng)封閉架構(gòu)(如Arm、x86)因需維護(hù)既有商業(yè)利益,在架構(gòu)調(diào)整與成本優(yōu)化上靈活性不足,為新興架構(gòu)留出了發(fā)展空間。而人工智能時(shí)代的計(jì)算模式已從傳統(tǒng)操作系統(tǒng)驅(qū)動(dòng)轉(zhuǎn)向Token生成驅(qū)動(dòng),對(duì)計(jì)算架構(gòu)的開(kāi)放性、靈活性提出了更高要求。
“在每一輪新的計(jì)算浪潮中,更開(kāi)放的架構(gòu)都取得了勝利,"吳雄昂指出,歷史規(guī)律反復(fù)印證這點(diǎn)——英特爾擊敗IBM,正是憑借X86架構(gòu)的開(kāi)放性打破了封閉生態(tài);Arm后來(lái)居上,則因其比x86更開(kāi)放的授權(quán)模式,讓安卓等軟件生態(tài)得以蓬勃發(fā)展,吸引眾多企業(yè)參與。同理,特斯拉初入電車領(lǐng)域時(shí)面臨“沒(méi)有充電樁”的質(zhì)疑,但創(chuàng)新者敢于突破,最終改變了行業(yè)格局。
"這一規(guī)律將在AI計(jì)算時(shí)代再次應(yīng)驗(yàn),主角換成了RISC-V。"因?yàn)镽ISC-V具有開(kāi)源特性,支持客戶進(jìn)行IP定制化設(shè)計(jì),不受特定工藝節(jié)點(diǎn)限制,且通過(guò)開(kāi)源協(xié)作機(jī)制推動(dòng)生態(tài)建設(shè),其發(fā)展邏輯與Linux在軟件領(lǐng)域的發(fā)展路徑有相似之處。?
他回憶起2018年在安謀科技領(lǐng)導(dǎo)團(tuán)隊(duì)開(kāi)發(fā)NPU產(chǎn)品時(shí),曾因架構(gòu)兼容性與軟件適配問(wèn)題遇到技術(shù)瓶頸的經(jīng)歷,這讓他意識(shí)到封閉架構(gòu)在定制化需求面前的局限性。而RISC-V的開(kāi)源特性與指令集模塊化設(shè)計(jì),不僅能降低開(kāi)發(fā)成本,還能解決CPU與NPU間的數(shù)據(jù)傳輸效率問(wèn)題,未來(lái)有望發(fā)展為集成多種處理器的XPU形態(tài),實(shí)現(xiàn)異構(gòu)計(jì)算協(xié)同。
另一方面,吳雄昂認(rèn)為,Arm早期憑借相對(duì)開(kāi)放的生態(tài)策略與可控的成本結(jié)構(gòu)獲得成功,但成為上市公司后,在定制化服務(wù)與成本控制方面的靈活性有所下降,難以滿足新興企業(yè)的創(chuàng)新需求。而RISC-V架構(gòu)不受傳統(tǒng)應(yīng)用形態(tài)約束,例如未來(lái)基于RISC-V的移動(dòng)終端,有望突破安卓生態(tài)與5G專利限制,以較低成本、較高靈活度實(shí)現(xiàn)差異化競(jìng)爭(zhēng)。
但他同時(shí)也坦承,“現(xiàn)在RISC-V的性能可以達(dá)到,但好用的程度還是很差的,這是現(xiàn)實(shí)。”
如今的 RISC-V,恰似處在發(fā)展早期的Arm。彼時(shí),開(kāi)發(fā)者普遍質(zhì)疑Arm的性能短板,甚至認(rèn)為它難以支撐瀏覽器這類基礎(chǔ)應(yīng)用的運(yùn)行。但正是憑借開(kāi)放性架構(gòu)與低成本的核心優(yōu)勢(shì),Arm吸引了大批企業(yè)大膽試水。當(dāng)一批創(chuàng)新者率先完成技術(shù)驗(yàn)證后,整個(gè)生態(tài)便進(jìn)入了高速迭代的快車道。事實(shí)證明,敢于突破的新銳企業(yè)往往具備更強(qiáng)的創(chuàng)新活力,唯有抓住新一輪技術(shù)革命的機(jī)遇,才能在市場(chǎng)競(jìng)爭(zhēng)中搶占先機(jī)、脫穎而出。
“如果沒(méi)有AI的爆發(fā),RISC-V根本不會(huì)有現(xiàn)在的機(jī)會(huì)——它最多在傳統(tǒng)計(jì)算領(lǐng)域切一小塊市場(chǎng),餓不死但也活不好。”吳雄昂說(shuō),正是AI的出現(xiàn)才帶來(lái)了真正的機(jī)遇。每一波技術(shù)創(chuàng)新浪潮中,由于新架構(gòu)門(mén)檻較低,愿意試錯(cuò)的新玩家能夠崛起;而那些相對(duì)保守、固守舊架構(gòu)的玩家反而會(huì)落后。“我敢賭五年后,AI架構(gòu)下的芯片生態(tài)肯定跟今天完全不同。”