廣告

DeepSeek發表最新V4模型預覽版 採用華為晶片

DeepSeek發表最新V4模型預覽版。美聯社 zoomin
DeepSeek發表最新V4模型預覽版。美聯社
分享 分享 連結 訂閱 APP

【財經中心╱台北報導】根據路透社今天報導,去年憑藉低成本模式震驚全球的中國AI新創公司DeepSeek,今天發表備受期待、針對華為晶片技術進行適配的新模型預覽版,凸顯中國在該領域日益成長的實力。

DeepSeek與華為在V4模型上的密切合作,與 DeepSeek過去對輝達的依賴形成鮮明對比。雖然這家新創公司沒有透露其最新模型所使用的哪款處理器。

DeepSeek 表示,新模型的專業版在全球知識基準測試中,表現優於其他開源模型,僅次於Google的閉源模型 Gemini-Pro-3.1。該版本主打高性能,在Agentic Coding(AI代理程式設計)評測中,已達到目前全球開源模型的最優水準,DeepSeek指出,Pro版本已成為公司內部開發的首選工具。根據內部測評,其使用體驗優於Anthropic的Sonnet 4.5,交付質量接近Opus 4.6的非思考模式,在數學、STEM及競賽型代碼評估中,其表現可比肩目前全球頂級閉源模型。

DeepSeek未提供模型完成時間表

V4還有一個價格更低的快閃記憶體版本,預覽版可讓公司蒐集實際使用者回饋,並在最終產品發表前進行改進。DeepSeek未提供該模型完成的時間表。

路透指出,在預覽版發表前一天,白宮指責中國大規模竊取美國AI實驗室的智慧財產權,有可能在下個月美中領導人峰會之前加劇兩國關係緊張。DeepSeek正處於這場爭議的中心,華盛頓指控其違反美國出口管制,非法取得輝達的尖端晶片來訓練其模型,Anthropic和OpenAI也表示,DeepSeek不當「提取」他們的專有模型。

總部位於杭州的DeepSeek承認使用輝達晶片,但並未就這些晶片是否受到出口禁令限制發表評論。該公司表示,其V3模型使用的數據是自然產生的,並透過網路爬蟲蒐集,並未有意使用OpenAI產生的合成數據。

華為與DeepSeek緊密合作

華為的昇騰AI晶片系列是中國減少對美國尖端半導體技術依賴的關鍵。華為周五表示,已與DeepSeek密切合作,使新的V4型號能夠在其全系列高性能係統上運行。

該公司表示,「Ascend(昇騰)的整個超級節點產品線現在都支援DeepSeek V4系列型號。」

DeepSeek在2025年初的快速發展,推動低成本開源模式在中國AI生態系統中佔據主導地位,並刺激許多中國競爭對手的崛起。

知嚴選

⭐️ 即刻下載!無蓋版廣告純淨版《知新聞》App

# DeepSeek # V4 # AI # AI模型 # 華為 # 輝達