創業新聞

中國 AI 晶片獨角獸寒武紀成功掛牌上市,高通、NIVIDIA 等 7 間芯片大廠新動向

unsplash.


編按:7月20日,中國人工智慧(AI)晶片獨角獸寒武紀正式在上海證券交易所 A 股科創板上市,行價為每股 64.39 元人民幣(約新台幣270元),開盤股價成長 288%,最高達到每股 250 元,成長率超過 290%,這家成立不到五年的企業,目前市值超過 1,000 億人民幣。寒武紀從獲得上交所受理到成功掛牌上市僅費時 68 天,成為中國 AI 晶片第一股,引起了業內的熱議和關注。

根據相關的資料顯示,目前中國 IC 設計企業已超過 1500 家。但 AI 晶片的公司卻比較少,新創僅超過 20 家。在這些 AI 晶片企業中,寒武紀是最突出的,尤其是最近的 IPO,科創上市第一天股票便一路飆升。那麼 AI 晶片到底是什麼,與普通的 CPU 有何區別呢?

從原理邏輯來看,AI 處理器是一種特殊的晶片,它結合了人工智慧技術和機器學習,使晶片的移動設備足夠智能,可以模仿人類的大腦,用於優化深度學習 AI 的工作,也是使用多個具有特定功能的處理器的系統。 而普通的 CPU 則被封裝在一個更小的晶片包中,設計用於支持移動應用程式,提供支持移動設備應用程式所需的所有系統功能。

大多數時候,各個大公司營銷團隊發現 AI (人工智慧)這個詞非常「前位且華麗」,所以他們幾乎把它捆綁到任何可能的商業用途中。因此,你肯定聽說過「人工智慧晶片」,其實它就是 NPU(神經網絡處理器) 的重命名版本,這些是特殊類型的 ASIC(特殊應用積體電路),旨在移動市場中將機器學習廣泛應用。

這些 ASIC 有一種特殊的架構設計,使它們能夠更快地執行機器學習模型,而不是將數據下載到服務器,然後等待它的回應。這種執行可能沒有那麼強大,但由於數據和處理中心之間的障礙更小,所以速度會更快。

NPU 比普通的 CPU 有什麼優勢?

通俗來說,我們可以理解為 NPU 就是 AI 晶片,普通晶片就是 CPU。

CPU(中央處理器) 在一般的負載環境中工作會很好,因為它有一個較高的IPC,可以通過許多串行執行。且 CPU 遵循的是馮紐曼架構,其核心是存儲程序、順序執行。CPU 的架構中需要大量的空間去放置存儲單元(Cache)和控制單元(Control),相比之下運算單元只佔據了很小的一部分,所以它在大規模同時計算能力上極受限制,而更擅長於邏輯控制。

NPU(神經網絡處理器) 和 GPU(圖形處理器) 的亮點在於它們能夠運行多個並行執行緒。 NPU 通過一些特殊的硬體級優化,比如為一些真正不同的處理器提供一些容易訪問的緩存系統,將其提升到另一個層次。這些高容量內核比通常的「常規」處理器更簡單,因為它們不需要執行多種類型的任務。這一整套的「優化」使得 NPU 更加高效,這就是為什麼這麼多的研發會投入到 ASIC 中的原因。

機器學習模型處理要求 CPU、DSP、GPU 和 NPU 同時同步,這是很多晶片處理單元在共同工作。但這也解釋了為什麼這樣執行對於移動設備來說是「沉重的」。

NPU 的優勢之一在於,大部分時間集中在低精度的演算法、新的數據流架構或內存計算能力——與 GPU 不同,它們更關注吞吐量而不是延遲。

創業邦

當然,AI 演算法是至關重要的,在圖像識別等領域,常用的是 CNN 卷積網絡,語音識別、自然語言處理等領域,主要是 RNN,這是兩類有區別的演算法。但是,他們本質上,都是矩陣或 vector 的乘法、加法,然後配合一些除法、指數等演算法。

另外,一個成熟的 AI 演算法,針對卷積運算和加權求和的特定數學進行了優化,這個過程非常快,它就像一個沒有圖形硬體的 GPU。對於 AI 晶片來說,如果確定了具體的目標尺寸,那麼總的乘法加法計算次數是確定的。比如一萬億次,我用AI晶片跑程序,吃頓飯的功夫就就解決了,而 CPU 需要運行好幾個禮拜,時間上的差距,沒有任何一家商業公司會浪費時間。

全球 AI 晶片公司有哪些?

除了寒武紀,中國國內還有這些比較有名的 AI 晶片公司比特大陸、地平線、天數智芯、熠知電子、探境科技、燧原科技、海思、嘉楠科技等公司,都是經歷了自 2015 年至現在的實際落地的檢驗期,才到現在狀況。各個公司的產品也都是獨特的,功耗、性能、應用場景都有自己的風格,可以在中國的廣大的市場中佔有一席之地。

中國 AI 晶片公司處於一個發展熱潮中,那國外 AI 的晶片發展情況又如何呢?現在讓我們來看看那些我們認為是人工智慧晶片頂級開發者的公司,儘管沒有任何特定的順序——只是那些已經展示了他們的技術並且已經將其投入生產或者即將投入生產的公司。具體如下:

1. Alphabet(谷歌母公司)

谷歌的母公司督促著人工智慧技術在多個領域的發展,包括雲計算、數據中心、移動設備和台式電腦。可能最值得注意的是它的張量處理單元(Tensor Processing Unit,TPU),這是一款專門為谷歌的 TensorFlow 編程框架設計的 ASIC,主要用於 AI 的兩個分支機器學習和深度學習。

谷歌的 Cloud TPU 是應用於數據中心或雲端解決方案,其大小相當於一張信用卡,但 Edge TPU 大小是小於一美分的硬幣,是專為某些特定的設備而設計的。儘管如此,更仔細觀察這一市場的分析師說,谷歌的 Edge TPU 不太可能在短期內出現在該公司自己的智能手機和平板電腦上,而更有可能被用於更高端、企業和昂貴的機器和設備。

2. Apple

蘋果多年來一直在開發自己 arm 晶片,最終可能會徹底停止使用英特爾(Intel)等供應商。蘋果也基本上擺脫了與高通的糾纏,看起來確實決心要在未來的人工智慧領域走自己的路。

該公司在最新款的 iphone 和 ipad 上使用了 A13「仿生」晶片。該晶片使用了蘋果的神經引擎,這是電路的一部分,第三方應用程序無法使用。 A13 仿生晶片比之前的版本更快,耗電更低。據報導,A14 版本目前正在生產中,今年可能會出現在該公司更多的移動設備上。

3. ARM

Arm (ArmHoldings)生產的晶片設計被包括蘋果在內的所有領先技術製造商採用。作為一個晶片設計師,它不製造自己的晶片,這給了它某種優勢,就像微軟不製造自己的電腦一樣。換句話說,Arm 在市場上有著巨大的影響力。該公司目前正沿著三個主要方向開發人工智慧晶片設計:Project Trillium,一種超高效、可擴展的新型處理器,目標是機器學習應用;機器學習處理器,這是不言而喻的; Arm NN 是神經網絡的縮寫,它是一種用於處理 TensorFlow 的處理器,Caffe 是一種深度學習框架,還有其他一些架構。

4. Intel (英特爾)

早在 2016 年,據華爾街日報報導,晶片巨頭英特爾宣布收購初創公 NervanaSystems,英特爾將獲得該公司的軟體、雲計算服務和硬體,從而使產品更好地適應人工智慧的發展。但它的人工智慧晶片系列,被稱為「神經網絡處理器」:**人工神經網絡模仿人類大腦的工作方式,通過經驗和實例進行學習,這就是為什麼你經常聽到機器和深度學習系統需要「訓練」。

隨著之前發布的 Nervana,英特爾似乎將優先解決與自然語言過程和深度學習相關的問題。

5. Nvidia (輝達)

在 GPU 市場中,我們提到過 GPU 處理人工智慧任務的速度比 CPU 快得多,Nvidia 看起來處於領先地位。

同樣,該公司似乎在新生的人工智慧晶片市場獲得了優勢。這兩項技術似乎是密切相關的,英偉達在 GPU 方面的進展有助於加速其人工智慧晶片的開發。事實上,GPU 似乎是 Nvidia 人工智慧產品的支撐,而其晶片組可以被稱為人工智慧加速器。 Jetson Xavier 於 2018 年已經發布,該公司 CEO 黃仁勳在新聞發布會上表示:「這台小電腦,將成為未來機器人的大腦。」

輝達創辦人在SIGGRAPH發表圖靈架構的工作站 Quadro RTX 顯示卡。
NVIDIA

深度學習似乎是輝達感興趣的主要領域,深度學習是一種更高層次的機器學習。你可以把機器學習看作是使用相對有限的數據集的短期學習,而深度學習使用在較長一段時間內收集的大量數據來返回結果,這些結果反過來被設計用來解決更深層次的、潛在的問題。

6. AMD(超微半導體)

和輝達一樣,AMD 是另一家與顯卡和 GPU 有著密切聯繫的晶片製造商,部分原因是過去幾十年電腦遊戲市場的增長,以及比特幣礦業的增長。 AMD 提供硬體和軟體解決方案,如 EPYC CPU 和 Radeon Instinct GPU 的機器學習和深度學習。 Epyc 是 AMD 為服務器(主要用於數據中心)提供的處理器名稱,而 Radeon 則是一款主要面向遊戲玩家的圖形處理器。

AMD 提供的其他晶片包括 Ryzen,也許還有更知名的 Athlon。該公司在人工智慧專用晶片的開發上似乎還處於相對早期的階段,但鑑於其在 GPU 領域的相對實力,觀察家們認為它將成為該市場的領導者之一。 AMD 已簽約向美國能源部提供 Epyc 和 Radeon 系統,用於建造世界上最快、最強大的超級計算機之一,被稱為“Frontier”。

Unsplash

7. Qualcomm (高通)

高通在智慧型手機熱潮開始之初就通過與蘋果的合作賺了一大筆錢,對於 Apple 停止購買其晶片的決定,高通可能覺得自己被冷落了。當然,高通本身在這個領域也不是什麼小公司,而且考慮到未來,一直在進行一些重大投資。

去年,高通發布了一款新的「雲人工智慧晶片」,似乎將其與其在第五代電信網絡(5G)方面的開發聯繫起來。這兩項技術被認為是構建自動駕駛汽車和移動計算設備新生態系統的基礎。 分析師表示,高通在人工智慧晶片領域算是後來者,但該公司在移動設備市場擁有豐富經驗,這將有助於實現其「讓設備上的人工智慧無處不在」的目標。

當然,其他還有 Samsung(三星)、TSMC(台積電)、 Facebook(臉書)、 IBM、 LG 等大型國際公司也在研發自己的 AI 晶片,誰能先掌握最前瞻的 AI 晶片,誰就能在新的經濟上升潮流中分一杯羹。

硬體的發展帶動未來 AI 技術落地的場景

各個大公司的市場部描繪給我們的現實與那些公司外的現實截然不同。儘管幾十年的研究給了我們處理信息和分類輸入的新方法,比以往任何時候都快,但我們購買的硬體中並沒有真正的 AI,因此哪家晶片公司能夠抓住市場痛點,最先實現應用落地,就可以在人工智慧晶片的賽道上取得較大優勢。

目前全球人工智慧產業依舊處在高速的發展中,不同的行業分佈為人工智慧的應用提供了廣闊的市場前景,商業化的社會需要人工智慧的應用,AI 晶片是實現演算法的硬體基礎,也是未來人工智慧時代的戰略制高點,全球的各大頂級公司會為此而一戰。但由於目前的 AI 演算法往往都各具優劣,只有給它們設定一個合適的場景才能最好地發揮它們的作用,也希望 AI 可以今早進入我們普通人的視線中。

從產業發展來看,現在還是人工智慧晶片的初級階段,無論是科研方向還是商業的應用都有非比尋常的創新空間。在應用場景中,演算法迭代的 AI 晶片向具備更高靈活性、適應性的通用智能晶片發展,這是是技術發展的必然方向。更少的神經網絡參數計算位寬,更多樣的分佈式存儲器定制設計,更稀疏的大規模向量實現,複雜異構環境下更高的計算效率,更小的體積和更高的能量效率,計算和存儲一體化將成為未來人工智慧晶片的主要特徵和發展趨勢。

本文授權轉載自創業邦,作者 Zach小生。

延伸閱讀

創業邦
合作轉載

是中國領先的專業創業服務平臺,致力於幫助創業者實現創業夢想,推動各領域高成長企業快速發展。創業邦為創業者提供高價值的資訊與服務,推動中國創新創業。旗下擁有傳媒互動、創業孵化、融資服務等業務。

Meet創業之星