NEWS

DeepSeek正式發布2款AI新模型　號稱性能勝GPT-5、Gemini 3.0 Pro　

記者黃惠瑜

發布 2025/12/02 16:25

#寰宇要聞

OpenAI的聊天機器人ChatGPT與中國大陸的深度求索（DeepSeek）皆是以大型語言模型為基底賦能的生成式AI應用。法新社

zoomin — OpenAI的聊天機器人ChatGPT與中國大陸的深度求索（DeepSeek）皆是以大型語言模型為基底賦能的生成式AI應用。法新社

【編譯黃惠瑜／綜合外電】中國大陸人工智慧（AI）新創DeepSeek近日一口氣推出2款全新AI模型，官方宣稱性能可匹敵甚至超越OpenAI的GPT-5以及谷歌（Google）的Gemini 3.0 Pro。此一發展可能會重塑美國科技巨頭與中國挑戰者之間的競爭格局。

本文大綱

技術大突破：稀疏注意力機制　運算成本暴降70%
實測超強：數學、編碼能力與頂尖模型平起平坐
在工具使用中思考的能力（Thinking in tool-use）
開源策略震撼業界
DeepSeek顛覆AI競爭規則

科技新聞網站VentureBeat報導，DeepSeek發布的2款模型分別是面向日常推理用途的DeepSeek-V3.2，以及高性能版本DeepSeek-V3.2-Speciale。DeepSeek-V3.2-Speciale在4項頂尖國際競賽中取得金牌級表現，包括2025年國際數學奧林匹亞競賽（IMO）、國際資訊奧林匹亞競賽（IOI）、國際大學生程式設計競賽（ICPC）世界總決賽和中國數學奧林匹亞競賽。

這次DeepSeek的發布，對美國的科技領先地位具有深遠的影響。DeepSeek再次證明，儘管美國祭出出口管制，限制中國取得高階輝達（Nvidia）晶片，但他們仍能打造出全球頂尖的AI系統。更令人震驚的是，DeepSeek選擇以最寬鬆的MIT開源專案授權條款，免費釋出這些模型。

一位參與該專案的貢獻者在X上放話，「大家以為DeepSeek只是一時的突破，但我們這次回來規模更大了」。這番言論立即引爆網路熱議，有用戶更宣告：「ChatGPT可以安息了。」

技術大突破：稀疏注意力機制　運算成本暴降70%

這次新模型的突破核心，在於其獨創的「稀疏注意力架構（DeepSeek Sparse Attention，DSA）」。這項架構創新，大幅減輕AI模型在處理長文件和複雜任務時的所需的運算負擔。

根據DeepSeek技術報告，DSA將處理長序列的推理成本降低約一半。以處理12萬8000個「詞元」（tokens，或譯作「符元」）為例，即相當於300頁的文件，解碼成本從舊模型的每百萬詞元需花費2.40美元（約75元台幣），驟降至0.70美元（約22元台幣），成本降幅高達70%。

實測超強：數學、編碼能力與頂尖模型平起平坐

在基於數學、程式設計與推理等領域的廣泛測試結果顯示，DeepSeek宣稱能與美國最強AI系統匹敵。

例如，在美國知名數學競賽AIME 2025中，DeepSeek-V3.2-Speciale的通過率達96%，略高於GPT-5-High的94.6%與Gemini-3.0-Pro的 95.0%。在哈佛-麻省理工學院數學競賽（HMMT）中，DeepSeek-V3.2-Speciale得分99.2%，也超越Gemini的97.5%。

DeepSeek標準版V3.2模型經過優化以適用日常情境，在AIME中取得93.1%、在HMMT取得92.5%，表現略低於最頂級模型，但所需計算資源大幅更少。

在工具使用中思考的能力（Thinking in tool-use）

除了純粹的推理能力之外，DeepSeek-V3.2引入「工具使用中思考」的能力，也就是模型能在執行程式碼、搜尋網路、操作檔案的同時，持續進行推理。

先前的AI模型有一個惱人的限制，即每次調用外部工具時，它們都會失去思路，必須從頭開始推理。DeepSeek的架構保留跨多個工具調用的推理軌跡，使AI能夠順暢的完成多步驟的問題解決流程。

開源策略震撼業界

與OpenAI和Anthropic等將最頂級模型鎖在專有系統內的做法不同，DeepSeek選擇將這2個尖端模型以最寬鬆的開源授權之一MIT授權公開釋出。

任何開發者、研究人員或公司都能自由下載、修改並部署這2個具備6850億參數的模型，不受任何限制。完整的模型權重、訓練程式碼與文件都已放在AI模型分享平台Hugging Face上。

這背後的策略意義重大。藉由免費開放具備尖端能力的模型，DeepSeek等於削弱競爭對手收取高額應用程式介面（API）費用的商業模式。對於企業客戶而言，這代表能以極低的成本獲得頂尖效能和部署的彈性。

不過，DeepSeek的全球擴張面臨地緣政治阻力。德國的資料保護當局專員坎普（Meike Kamp）6月表示，根據歐盟規定，DeepSeek 將德國用戶資料傳輸到中國的行為屬於非法，因此已要求蘋果（Apple）和Google將該應用程式下架。義大利則於2月下令限制DeepSeek封鎖其應用程式。美國國會議員也以國家安全為由，推動禁止政府設備使用該服務。

DeepSeek顛覆AI競爭規則

這次DeepSeek的發布正值一個關鍵時刻。在龐大資金湧入AI領域多年後，一些分析師已開始質疑AI產業是否正在泡沫化。DeepSeek能以極低的成本，創造出匹敵美國的尖端模型，這使得傳統認為要取得AI領先地位需要龐大資本支出的假設受到挑戰。如今的問題已不再是中國的AI能否與矽谷一較高下，而是當中國競爭對手免費提供同等技術時，美國公司能否維持他們的領先地位。