1. <p id="f1kd3"></p>

    <p id="f1kd3"><label id="f1kd3"><xmp id="f1kd3"></xmp></label></p>
  2. “天命人”TPU正面挑戰GPU
    CPU誕生,讓英特爾在PC時代長期獨占鰲頭;GPU崛起,讓英偉達一躍而起風光無二。xPU時代正在到來,由谷歌TPU衍生而出的未來,誰又將乘勢而起?
    2024-09-14 10:58:31
    來源:中國電子報、電子信息產業網 楊鵬岳??

    CPU誕生,讓英特爾在PC時代長期獨占鰲頭;GPU崛起,讓英偉達一躍而起風光無二。xPU時代正在到來,由谷歌TPU衍生而出的未來,誰又將乘勢而起?

    在全球科技產業將目光緊緊鎖定人工智能領域之際,TPU(Tensor Processing Unit,張量處理器)正在悄悄成長為AI時代的“弄潮兒”。

    GPU用于大模型訓練、推理存在高能耗、高成本等問題,由AI算力需求增長帶來的種種問題,或許可以從TPU身上找到更為理想的答案。

    TPU“攻入”AI主流市場

    由于入局早、算力強,由英偉達提供的GPU芯片幾乎已成為各大企業訓練、推理模型,處理AI相關算力需求的標配。但當前,TPU芯片也正在逐步進入AI算力主流芯片市場。

    TPU由谷歌率先推出。從初代芯片推出至今,TPU的應用范圍正逐步擴大,谷歌以外的市場也逐漸打開。

    最初,TPU是谷歌專為加速機器學習和深度學習任務而設計的專用芯片,特別是針對深度學習模型的訓練和推理。2013年,谷歌開始研發TPUv1,這是全球首款專為AI打造的加速器。2017年,谷歌推出Cloud TPU,用于處理云端計算任務。

    自2022年底生成式人工智能獲得產業界廣泛關注以來,TPU在生成式人工智能領域的應用范圍也逐步拓寬。例如,2023年12月,谷歌推出多模態通用大模型Gemini的三個不同版本,該模型的訓練大量使用了Cloud TPU v5p芯片。

    谷歌曾表示,TPU是其推出許多服務的最大功臣之一,要是少了它,如即時語音搜尋、相片物件辨識及互動式語言翻譯等無法絲滑運行,還有最先進的Gemini、Gemma、Imagen模型等也無法順利問世。

    今年5月,谷歌又發布了第六代TPU芯片Trillium。據悉,Trillium能在單個高帶寬、低延遲Pod中擴展為多達256個TPU的集群,相較于前代產品,Trillium在適配模型訓練方面的功能更強。

    同時,TPU芯片也逐漸走出谷歌公司,獲得更大范圍的市場青睞。一如,7月30日蘋果公司發布的一篇研究論文稱,蘋果在訓練Apple Intelligence生態中的人工智能模型AFM時,選擇了谷歌的兩種張量處理單元(TPU)云集群。

    性價比優勢成為“焦點”

    在以英偉達產品為代表的GPU在算力基礎設施市場“一騎絕塵”的情況下,TPU何以嶄露頭角,又何以贏得蘋果等全球知名企業的青睞?

    市場分析師表示,以GPU為代表的通用計算架構和針對特定領域的DSA(Domain Specific Architecture,面向特定領域)計算架構是目前兩大主流AI芯片設計思路。但在市場容量巨大的應用領域,計算芯片的架構演進總呈現出從通用型向專用型轉變的規律。

    隨著大模型訓練的計算量和復雜度的指數級增長,傳統GPU成本昂貴、算力利用率低、能耗大的局限日益凸顯。

    今年1月,扎克伯格發帖公布了一組數字:到2024年底,Meta“大規模的計算基礎設施”將包括高達35萬張英偉達H100顯卡,為Meta在人工智能領域的突破提供強大支持。如果將其他GPU計算在內,Meta的計算基礎設施將擁有“相當于近60萬張H100的算力”。這將是一筆巨大的開銷。

    與此同時,馬斯克表示,2024年特斯拉僅僅在英偉達的人工智能芯片上就將耗費超過5億美元,特斯拉未來還需要價值“數十億美元”的硬件才能趕上最大規模的競爭對手。

    高昂的算力成本,使一眾全球頂尖的科技企業望而生畏。在此背景下,作為AI專用芯片之一的TPU被業界期待能夠從新的技術路線上另辟蹊徑。在這方面,谷歌已經提供了成功經驗。據谷歌副總裁兼工程院士Norm Jouppi透露,TPU的出現足足讓谷歌省下了15 個數據中心的建設成本。

    探索市場新可能

    從產品邏輯來看,作為一種專用集成電路(ASIC),TPU專為單一特定目的而設計,用以運行構建AI模型所需的獨特矩陣和基于矢量的數學運算。而GPU的設計初衷是處理圖像信息。因此,從架構設計的角度來看,相比于適合處理高度并行任務的GPU, TPU更適用于處理矩陣乘法等神經網絡算法。

    “TPU具有為AI大模型而生的天然優勢架構?!盩PU架構AI芯片公司中昊芯英創始人兼CEO楊龔軼凡在接受《中國電子報》記者采訪時表示,TPU專為神經網絡結構而設計,在相同制造工藝、能耗和芯片尺寸條件下,性能優于GPU 3~5倍。在適用場景上,TPU為已有的算法和框架進行優化,性能和功耗表現均優于GPU,更適用于深度學習模型的大規模部署。深度學習無疑仍是AI領域的主導力量,深度學習的某個分支將承載著未來100%的AI應用。從長遠來看,TPU比GPU在AI賽道上更具競爭力。

    在TPU芯片領域,產業界正在進行不同的嘗試。

    一方面,“先行者”谷歌探索出了自己的專屬路線。

    咨詢公司D2D Advisory首席執行官Jay Goldberg直言,今天只有兩家公司有著成熟的芯片研發體系來訓練人工智能模型,一個是英偉達的GPU,另一個是谷歌的TPU。但區別于英偉達,谷歌并不會以獨立產品的形態單獨出售自己的TPU芯片,而是通過谷歌云平臺向外部客戶提供基于TPU的算力服務。

    另一方面,更多芯片從業者仍在探索基于TPU架構的新產品。

    今年2月,美國AI芯片初創公司Groq憑借其開發的新型AI處理器LPU(Language Processing Unit)引發關注,使用的TSP(張量流處理器)源頭是谷歌研發的TPU。今年4月,英特爾推出了專攻深度學習神經網絡推理的類TPU芯片Gaudi 3。

    值得關注的是,國內初創AI芯片企業中昊芯英歷時近五年,已成功量產全自研的國內首枚TPU AI訓練芯片,并自研AIGC預訓練大模型,正在與行業伙伴進行金融、教育、醫療等垂直領域專業大模型的探索落地。業界普遍認為,TPU芯片在中國市場的應用,更有助于TPU這一產品門類的成熟。

    當然,無論從技術還是生態角度,TPU和類TPU芯片都處于“嬰兒期”,需要進一步發展。但是,AI時代已經到來,算力需求才露出冰山一角。在龐大需求下,新生事物更有施展拳腳的可能。

    最新文章
    關于我們

    微信掃一掃,加關注

    商務合作
    • QQ:61149512
    久久国产精品国产四虎90后|you jiz zz com无码一区二区|亚洲中文精品人人永久免费|一本大道道久久九九av综合

    1. <p id="f1kd3"></p>

      <p id="f1kd3"><label id="f1kd3"><xmp id="f1kd3"></xmp></label></p>