廣告

DeepSeek正式發布2款AI新模型 號稱性能勝GPT-5、Gemini 3.0 Pro 

出版時間:2025/12/02 16:25
國際 寰宇要聞
黃惠瑜 文章
OpenAI的聊天機器人ChatGPT與中國大陸的深度求索(DeepSeek)皆是以大型語言模型為基底賦能的生成式AI應用。法新社 zoomin
OpenAI的聊天機器人ChatGPT與中國大陸的深度求索(DeepSeek)皆是以大型語言模型為基底賦能的生成式AI應用。法新社
分享 分享 連結 訂閱 APP

【編譯黃惠瑜/綜合外電】中國大陸人工智慧(AI)新創DeepSeek近日一口氣推出2款全新AI模型,官方宣稱性能可匹敵甚至超越OpenAI的GPT-5以及谷歌(Google)的Gemini 3.0 Pro。此一發展可能會重塑美國科技巨頭與中國挑戰者之間的競爭格局。

科技新聞網站VentureBeat報導,DeepSeek發布的2款模型分別是面向日常推理用途的DeepSeek-V3.2,以及高性能版本DeepSeek-V3.2-Speciale。DeepSeek-V3.2-Speciale在4項頂尖國際競賽中取得金牌級表現,包括2025年國際數學奧林匹亞競賽(IMO)、國際資訊奧林匹亞競賽(IOI)、國際大學生程式設計競賽(ICPC)世界總決賽和中國數學奧林匹亞競賽。

這次DeepSeek的發布,對美國的科技領先地位具有深遠的影響。DeepSeek再次證明,儘管美國祭出出口管制,限制中國取得高階輝達(Nvidia)晶片,但他們仍能打造出全球頂尖的AI系統。更令人震驚的是,DeepSeek選擇以最寬鬆的MIT開源專案授權條款,免費釋出這些模型。

一位參與該專案的貢獻者在X上放話,「大家以為DeepSeek只是一時的突破,但我們這次回來規模更大了」。這番言論立即引爆網路熱議,有用戶更宣告:「ChatGPT可以安息了。」

技術大突破:稀疏注意力機制 運算成本暴降70%

這次新模型的突破核心,在於其獨創的「稀疏注意力架構(DeepSeek Sparse Attention,DSA)」。這項架構創新,大幅減輕AI模型在處理長文件和複雜任務時的所需的運算負擔。

根據DeepSeek技術報告,DSA將處理長序列的推理成本降低約一半。以處理12萬8000個「詞元」(tokens,或譯作「符元」)為例,即相當於300頁的文件,解碼成本從舊模型的每百萬詞元需花費2.40美元(約75元台幣),驟降至0.70美元(約22元台幣),成本降幅高達70%。

實測超強:數學、編碼能力與頂尖模型平起平坐

在基於數學、程式設計與推理等領域的廣泛測試結果顯示,DeepSeek宣稱能與美國最強AI系統匹敵。

例如,在美國知名數學競賽AIME 2025中,DeepSeek-V3.2-Speciale的通過率達96%,略高於GPT-5-High的94.6%與Gemini-3.0-Pro的 95.0%。在哈佛-麻省理工學院數學競賽(HMMT)中,DeepSeek-V3.2-Speciale得分99.2%,也超越Gemini的97.5%。

DeepSeek標準版V3.2模型經過優化以適用日常情境,在AIME中取得93.1%、在HMMT取得92.5%,表現略低於最頂級模型,但所需計算資源大幅更少。

在工具使用中思考的能力(Thinking in tool-use)

除了純粹的推理能力之外,DeepSeek-V3.2引入「工具使用中思考」的能力,也就是模型能在執行程式碼、搜尋網路、操作檔案的同時,持續進行推理。

先前的AI模型有一個惱人的限制,即每次調用外部工具時,它們都會失去思路,必須從頭開始推理。DeepSeek的架構保留跨多個工具調用的推理軌跡,使AI能夠順暢的完成多步驟的問題解決流程。

開源策略震撼業界

與OpenAI和Anthropic等將最頂級模型鎖在專有系統內的做法不同,DeepSeek選擇將這2個尖端模型以最寬鬆的開源授權之一MIT授權公開釋出。

任何開發者、研究人員或公司都能自由下載、修改並部署這2個具備6850億參數的模型,不受任何限制。完整的模型權重、訓練程式碼與文件都已放在AI模型分享平台Hugging Face上。

這背後的策略意義重大。藉由免費開放具備尖端能力的模型,DeepSeek等於削弱競爭對手收取高額應用程式介面(API)費用的商業模式。對於企業客戶而言,這代表能以極低的成本獲得頂尖效能和部署的彈性。

不過,DeepSeek的全球擴張面臨地緣政治阻力。德國的資料保護當局專員坎普(Meike Kamp)6月表示,根據歐盟規定,DeepSeek 將德國用戶資料傳輸到中國的行為屬於非法,因此已要求蘋果(Apple)和Google將該應用程式下架。義大利則於2月下令限制DeepSeek封鎖其應用程式。美國國會議員也以國家安全為由,推動禁止政府設備使用該服務。

DeepSeek顛覆AI競爭規則

這次DeepSeek的發布正值一個關鍵時刻。在龐大資金湧入AI領域多年後,一些分析師已開始質疑AI產業是否正在泡沫化。DeepSeek能以極低的成本,創造出匹敵美國的尖端模型,這使得傳統認為要取得AI領先地位需要龐大資本支出的假設受到挑戰。如今的問題已不再是中國的AI能否與矽谷一較高下,而是當中國競爭對手免費提供同等技術時,美國公司能否維持他們的領先地位。

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

# DeepSeek # OpenAI # GPT-5 # Google # Gemini 3.0 Pro # AI # 人工智慧