訪談|后摩智能吳強(qiáng):存算一體有機(jī)會(huì)挑戰(zhàn)英偉達(dá)
9月28日,2023全球智能汽車產(chǎn)業(yè)大會(huì)(GIV2023)在安徽合肥舉行。后摩智能創(chuàng)始人兼CEO吳強(qiáng)在大會(huì)上做了主題演講。會(huì)后,吳強(qiáng)接受了太平洋汽車等多家媒體的采訪,他表示,用傳統(tǒng)方式挑戰(zhàn)英偉達(dá),機(jī)會(huì)太渺茫了,用存算一體等新的技術(shù)路徑挑戰(zhàn)不一定一舉成功,但是機(jī)會(huì)大很多。
汽車智能化正在快速發(fā)展,一方面算法、模型在持續(xù)演進(jìn)和變得多樣化,比如從最初的CNN模型,到最近的Transformer 、BEV這樣的大模型。另外一方面,未來幾年智能駕駛的體驗(yàn)會(huì)有一個(gè)質(zhì)的提升,比如從現(xiàn)在的L1/L2、高速NOA,快速普及通勤NOA或者城區(qū)NOA。毫無疑問,這些對(duì)計(jì)算芯片的處理能力都提出了更高的要求,需要更強(qiáng)處理能力的芯片。
那么,如何才能讓芯片具有更強(qiáng)性能的同時(shí),把芯片的成本也降下來,后摩智能給出的答案是存算一體,通過技術(shù)創(chuàng)新去解決芯片計(jì)算效率提升過程中的一些本質(zhì)問題。吳強(qiáng)說,芯片計(jì)算效率的提升主要面臨兩個(gè)本質(zhì)問題。一個(gè)是存儲(chǔ)墻,計(jì)算效率的提升很大一個(gè)問題取決于計(jì)算和存儲(chǔ)的距離,本質(zhì)其實(shí)是計(jì)算和存儲(chǔ)之間的距離太長,比如電在硅上的速度很明確就是每秒鐘6萬公里,芯片時(shí)鐘在3GHz左右,每個(gè)時(shí)鐘周期電移動(dòng)就是20毫米左右的距離,這是物理的規(guī)律。如果存儲(chǔ)和計(jì)算分的很遠(yuǎn),就會(huì)有很長的存儲(chǔ)的延時(shí)。另外一個(gè)本質(zhì)問題就是功耗。研究顯示,移動(dòng)數(shù)據(jù)的功耗比計(jì)算本身的功耗高2到3個(gè)數(shù)量級(jí),大概是幾百倍甚至千倍的水平。
如果不能拉近存儲(chǔ)和數(shù)據(jù)的距離、提高訪存的帶寬和減少訪存的功耗,那么芯片效率提升面臨的是一個(gè)不可逾越的障礙和挑戰(zhàn)。傳統(tǒng)的解決辦法是希望增加DRAM的帶寬、減少DARM訪存的開銷。比如我們電腦里面L2緩存,寬帶從100 GB/s到200 GB/s;英偉達(dá)的游戲卡,帶寬幾百GB/s到 TB/s左右;英偉達(dá)的H100,帶寬到了1TB/s到3TB/s左右。但這種方式的成本越來越高,容量也有一定的限制。
針對(duì)上述痛點(diǎn),很早以前,人們就想到了一種解決方法:如果計(jì)算和存儲(chǔ)的距離太遠(yuǎn),為什么不把它拉近一點(diǎn)甚至可以重新融合在一起,這個(gè)就是所謂的將存儲(chǔ)和計(jì)算融為一體的想法。廣義存算一體分為兩種,一種是近存計(jì)算、一種是存內(nèi)計(jì)算,近存計(jì)算是說把計(jì)算和存儲(chǔ)拉得更近,存內(nèi)計(jì)算是說完全融合在一起。最近10年,AI逐漸爆發(fā),存算一體技術(shù)終于迎來了最好的場景,就是AI計(jì)算。特斯拉的Dojo用的就是近存計(jì)算。
吳強(qiáng)表示,對(duì)于智能駕駛來說,用存算一體技術(shù)來做智駕芯片的意義主要有兩個(gè),一方面是上限更高,存算一體本身是底層架構(gòu)的創(chuàng)新,計(jì)算效率對(duì)比傳統(tǒng)架構(gòu)能有一個(gè)數(shù)量級(jí)以上的提升。另一方面是它的底限穩(wěn),用成熟工藝仍然可以做出媲美國外巨頭的芯片產(chǎn)品,比如28納米存算架構(gòu),可以做出類似7納米傳統(tǒng)架構(gòu)的性能效果。
事實(shí)上,2023年5月,后摩智能正式推出了存算一體智駕芯片后摩鴻途™H30,物理算力達(dá)到256TOPS,典型功耗僅為35W。根據(jù)后摩實(shí)驗(yàn)室及MLPerf公開測試結(jié)果,在ResNet50性能功耗對(duì)比上,采取12nm制程的H30相比某國際芯片巨頭的7nm同類芯片性能提升超2倍,功耗減少超50%。
當(dāng)問及為什么國外芯片大廠不做存算一體,更多是創(chuàng)新創(chuàng)業(yè)公司在做時(shí),吳強(qiáng)解釋說,國外的創(chuàng)新公司也在做。但像英偉達(dá)、AMD這樣的芯片大廠卻很難去做,因?yàn)樗麄冊(cè)趥鹘y(tǒng)的架構(gòu)體系中有很深的積淀,與之配套的整個(gè)軟件生態(tài)已經(jīng)走得很遠(yuǎn),改變架構(gòu)就需要他們舍棄太多原來積淀下來的東西,軟件生態(tài)既是它的優(yōu)勢,同時(shí)也是它的歷史包袱。在吳強(qiáng)看來,后摩智能真正的壁壘是差異化的產(chǎn)品性能。他透露,跟國際大廠相比,后摩智能的產(chǎn)品性能可以提升好幾倍,不是1到2倍,而是5倍甚至更多。
對(duì)于未來的前景,吳強(qiáng)表現(xiàn)的很樂觀。他認(rèn)為在智能駕駛領(lǐng)域,未來會(huì)是傳統(tǒng)芯片和存算一體芯片并存的局面。大家一定會(huì)用新的方式和技術(shù)去挑戰(zhàn)英偉達(dá),因?yàn)橛脗鹘y(tǒng)的方式去挑戰(zhàn)它難度太大了。此外,這幾年汽車芯片本土化、國產(chǎn)化進(jìn)程不斷在加速,創(chuàng)業(yè)公司迎來了難得的歷史機(jī)遇,政策環(huán)境和創(chuàng)業(yè)土壤給了后摩智能這些技術(shù)創(chuàng)新型企業(yè)一個(gè)生存的機(jī)會(huì),可以度過前面短暫的黑暗周期,他相信,后摩智能一定可以靠高性能產(chǎn)品跑出來。
>>點(diǎn)擊查看今日優(yōu)惠<<