路透:字節跳動擬用華為晶片 研發新AI大型語言模型

分享到

(中央社華盛頓30日綜合外電報導)路透社引述3名知情人士說法報導,受到美國制裁影響,短影音平台TikTok的中國母公司「字節跳動」計劃採用華為晶片進行訓練,以研發新的人工智慧(AI)模型。

路透社報導,美國2022年開始限制輝達(Nvidia)等先進AI晶片出口以來,字節跳動(ByteDance)轉向發展國內AI晶片供應商多元化,並加速研發自有技術。

AI已成為科技產業核心。遊戲、電子商務等領域的企業都透過整合客製化AI模型,即採用模式識別來做決策的程式,以提供與眾不同的產品選項。

消息人士說,字節跳動在這場AI競賽中的下一步,是利用華為的昇騰(Ascend)910B晶片來訓練AI大型語言模型。

另名消息人士也稱,字節跳動正計劃推出新的AI模型,但無法證實是否將採用華為的晶片。

3名知情人士和另名消息人士指出,字節跳動已將昇騰910B晶片用於運算強度較低的推理任務,這些任務採用預訓AI模型來進行預測。

然而,訓練AI模型所需晶片的要求遠高於此,不僅要能處理極大量資料,效能也要極佳,例如輝達的高階繪圖處理器(GPU)。

消息人士透露,依運算參數來衡量,新模型的效能和複雜性將不像字節跳動現有的AI模型「豆包」那麼強大。

針對報導內容,字節跳動和華為均未回覆置評請求。TikTok駐華府發言人休斯(Michael Hughes)則代表字節跳動表示:「這裡的整個前提都是錯的。(我們)沒有在研發新模型。」

一名知情人士說,字節跳動今年已訂購至少10萬個昇騰910B晶片,但截至7月,僅拿到不到3萬個,交貨速度顯然無法滿足字節跳動的需求。

兩名知情人士說,由於供應受限,運算能力又不如輝達在中國銷售的晶片,導致字節跳動無法為新模型設定時間表。

自今年初以來,聊天機器人這類應用程式使用率愈來愈高,「豆包」已是中國最受歡迎的應用程式之一,每月有超過1000萬名活躍用戶。

消息人士說,AI日益受到重視,也讓字節跳動成為華為AI晶片最大買家之一。

消息人士還說,字節跳動也是輝達H20晶片的最大買家。輝達為遵守美國當局的制裁措施,專為中國市場推出這款晶片。(譯者:曾依璇/核稿:施施)1130930