半導體聯盟報道,7月20日,有著“AI芯片第一股”之稱的中科寒武紀科技(以下簡稱“寒武紀”)正式登陸科創盤。從股票發行至今的數據來看,寒武紀在股市的表現相當亮眼,至7月22日收盤,市值已經達到1124.28億元。相比257.62億元的發行市值,寒武紀的市值在三天時間里增長了336%。這幾年,我國AI芯片市場加速成長。但是,當前AI芯片處于產業化早期,企業大多面臨盈利難的問題,如何加快技術成果轉化,仍然是AI芯片企業面臨的關鍵課題。
“AI芯片第一股”備受期待
市值的大小、股價的高低,在一定程度上反映出資本市場對上市企業及其所在產業發展水平和未來前景的判斷。有行業分析師《中國電子報》記者聲稱,寒武紀在股市的活躍表現,一方面是因為科創板正處于被資本高度關注的時刻,資金流動較為活躍;另一方面,寒武紀的主營業務是AI芯片,目前來看,AI芯片的前景被各方看好,是資本市場非常注重的方向。
從誕生之初,寒武紀就備受各方期待。2017年,寒武紀科技完成1億美元A輪融資,估值達到10億美元,成為AI芯片領域首個“獨角獸企業”。同年,華為推出的全球首款內置獨立NPU麒麟970搭載寒武紀1A模塊,寒武紀一戰成名,打響了市場知名度。目前,寒武紀形成了面向云、邊、端的系列化智能芯片產品和平臺化基礎系統軟件。其智能終端IP模塊已集成于超過1億臺智能手機及其他智能終端設備中,面向云端、邊緣端的思元系列產品也已應用于浪潮、聯想等多家服務器廠商的產品中。
半導體屬于資金、技術、人才密集型產業。研發資金、專利技術和人才儲備,通常是市場衡量半導體企業實力的關鍵因素。研發投入方面,在2017、2018、2019三個年度,寒武紀研發投入占營業收入的比例分別為380.73%、205.18%、122.32%,三年累計研發投入8.13億元。專利技術方面,寒武紀主要面向智能芯片及相關領域進行布局,截至2020年2月29日,已獲授權的境內外專利達65項,PCT專利申請120項。人才儲備方面,截至2019年年底,寒武紀研發人員占總體員工人數的79.25%,碩士及以上學歷的員工占比超過63%。
業內人士葛婕向《中國電子報》記者指出,寒武紀通過與華為手機AI芯片的合作,打開了市場知名度。相對目前國內其他AI芯片公司,寒武紀已經有落地應用的場景和實例,得到了部分用戶的認可。同時,創始人陳云霽、陳天石出身中科大“天才少年班”的履歷光環,也增強了資本市場對公司后續發展的信心。不過寒武紀目前仍處于虧損狀態,需要更充足的應用落地和客戶來支撐公司的良性發展。
寒武紀這回募集資金的主要用途是云端和邊緣端智能芯片的研發,投入方向與公司目前的業務轉型方向相符。2018年起,華為海思選擇自行研發智能芯片,不再使用寒武紀的IP,導致寒武紀終端智能處理器IP業務營收驟減,云端智能芯片及加速卡轉而成為營收最高的業務。寒武紀通過發行股票募集的資金,將用于新一代云端訓練芯片及系統、云端推理芯片及系統、邊緣端AI芯片及系統3個項目。寒武紀聲稱,云端智能芯片的升級換代將有利于公司更好地為云計算時代提供高性能、高安全的服務器加速芯片及其平臺產品;邊緣端芯片的研發項目將完善公司云邊端一體化的發展戰略,彌補市場上邊緣加速方案的空白,為公司儲備新的業務增長點。
國內外企業搶灘AI芯片
有別于CPU、GPU、FPGA、DSP等通用芯片,AI芯片通常指專門針對AI領域設計的芯片。葛婕聲稱,AI芯片通常指針對特定應用需求而專門設計,可擴展性不及GPU等通用芯片,但在性能、面積、功耗上一般可以進行針對性的優化,算法更加高效,對互聯網公司等某些需求可以實現定制化加速。
目前,AI芯片已成為國內外科技巨頭的搶灘之地。集邦咨詢(TrendForce)分析師姚嘉洋向《中國電子報》記者聲稱,AI芯片的發展,會面臨不同精度運算的工作負載,對FP32(單精度)、FP16(半精度)以及INT8(8位定點運算)與INT4(4位定點運算)的支持已經是AI芯片的必備條件。同時,AI芯片的競爭指標還包括AI運算效能的展現、功耗的多少以及芯片本身的面積與成本等。發展趨勢方面,除了運算架構仍要持續優化外,采用先進制程也是助力AI芯片整體表現的關鍵要素。此外,若投入加速卡產品的發展,存儲器的搭配與選用也是關鍵。
谷歌的TPU是AI芯片的代表作。TPU是為谷歌Tensorflow深度學習框架打造的AI芯片,通過谷歌云平臺開放給客戶使用,目前云TPU 3.0版本算力達到420TFLOPS,基于云TPU集群打造的TPU Pod可提供每秒超過100千萬億次浮點運算。天風證券分析師指出,谷歌將TPU開放給客戶是為了提供差異化的云計算服務,提升谷歌云的機器學習服務的易用性。通過Cloud TPU和TensorFlow的軟硬結合,以及TPU Pod的加持,可進一步激活中小企業以及科研單位的云計算需求,構建差異化競爭優勢。
長期占據云服務頭把交椅的亞馬遜也不甘示弱,推出了高性能機器學習加速芯片Inferentia,能夠提供128TFLOPS的算力,并支持INT8和BF16(混合精度)/FP16計算類型。移動通信芯片龍頭高通推出了面向邊緣側的專用AI芯片Cloud 100,采用7nm制程,運算速度超過100TFLOPS。
我國企業也在AI芯片積極布局,并在部分算力參數上接近甚至領先國際一流水平。
寒武紀于2018年推出了中國首款高峰值云端智能芯片思元100,2019年推出了第二代產品思元270,均采用臺積電16nm制程。思元270理論峰值性能達到256TFLOPS(INT4)、128TFLOPS(INT8)、64TFLOPS(INT16)。從招股書披露的信息來看,寒武紀下一代云端智能芯片思元290采用了臺積電7nm制程,已處于內測階段。
姚嘉洋聲稱,在2019年,思元270相關產品線便已經支持INT4規格。在2018年下半年左右,英偉達的Turing架構確定支持INT4。以整體AI芯片市場來看,寒武紀在這方面的布署可謂超前。
華為、阿里巴巴的AI處理器,也在衡量AI計算能力的ResNet-50模型訓練中有著可圈可點的表現。華為的昇騰910 AI處理器在INT8下的性能達到512TFLOPS,FP16下的性能達到256TFLOPS。在ResNet-50模型訓練中,由1024顆昇騰910組成的AI訓練集群Atlas900,只用了59.8秒就完成了訓練,比原先的世界紀錄快了10秒。阿里巴巴的NPU AI芯片含光800采用12nm工藝,支持INT8/INT16量化加速,以及FP16/BFP16向量計算。據阿里達摩院院長張建鋒介紹,在ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI芯片性能高4倍。
此外,騰訊領投的AI芯片企業燧原科技推出了面向云端的云燧系列;地平線推出了面向自動駕駛的征程系列和面向智能攝像頭的旭日系列處理器。同時,越來越多的初創企業進軍智能語音等特定AI場景的芯片研發,我國AI芯片初步呈現出多點開花的發展態勢。
如何推動商業落地,仍是關鍵問題
雖然社會各界高度關注AI芯片的發展,但盈利難仍然是AI企業普遍面臨的難題。招股書披露,寒武紀2017、2018和2019年度,公司凈利潤分別為-38070萬元、-4104萬元和-117912萬元,仍處于虧損狀態。如何推動技術成果轉化,實現商業模式落地,是考驗AI企業生存能力的關鍵課題。
葛婕聲稱,AI芯片需要與算法和特定應用場景深度結合,針對語音識別、計算機視覺、機器學習等不同的算法,均需要專用芯片進行適配以實現相應功能,同時隨著算法的迭代進化,需要芯片同步優化以發揮算法的最佳性能。目前較大的市場包括云端服務器、智能駕駛、安防等,但是市場還沒有完全放量,無法支撐企業的盈利表現。
上述行業分析師指出,國內AI的研發投入是分散式的,集中在單一應用,面臨著投入高市場小的問題。形成平臺化的服務能力,走產品化路線,是AI企業提升營收能力的關鍵。
“我國AI企業在算法和IP上投入了很多精力,但是靠算法和IP還是很難盈利的,還是要把芯片做出來,走產品化路線,進而和終端應用等下游需求結合起來。”行業分析師說。
隨著5G、物聯網時代來臨,下游應用場景對AI的需求將進一步釋放,為AI芯片企業帶來更多成長機遇。同時,更加細分的應用市場,也對AI企業能否緊跟市場形勢,借助場景實現規模化發展提出要求。
燧原科技CEO趙立東聲稱,與國外大廠相比,國內AI芯片企業與本土客戶和應用開發商接觸更多,緊跟國內AI應用變化趨勢,反應更及時。同時,要吸納高端人才,開發高端芯片。
集邦咨詢分析師姚嘉洋向記者聲稱,中國眾多互聯網企業或是網絡服務從業者越來越傾向于通過AI助力自身服務。本土AI芯片公司能更快根據當地客戶的需求做出反應,這是一種“地利”優勢?,F在需要關注的是,如何深化與國內客戶的合作關 系,來打造市場所期待的營收表現。