ChatGPT-5.2新模型來了! 對日常用戶和工作用戶意味什麼
【編譯張翠蘭/綜合報導】美國人工智慧(AI)龍頭OpenAI周四(12/11)發布升級版ChatGPT-5.2模型,稱是該公司迄今在科學和數學領域最強大的專業知識工作AI模型,尤其適用於電子表格和程式設計等工作相關任務。
OpenAI在聲明中強調,新模型ChatGPT-5.2的用途不僅限於日常個人任務,更著重於工作相關活動。
聲明寫道:「我們設計GPT-5.2的目的是為了給人們創造更大的經濟價值」、「在創建電子表格、製作簡報、編寫程式碼、感知圖像、理解長篇上下文、使用工具以及處理複雜的多步驟專案方面都表現更出色。」
根據科技網站CNET指出,GPT-5.2共有三個模型。
GPT-5.2 Instant旨在快速且有效率服務於日常活動。這是一款日常工作與學習工具,在資訊查詢、操作指南、逐步說明、技術寫作與翻譯方面都有顯著提升,並延續前一代所導入的溫暖對話語氣。早期測試人員特別指出,模型提供的說明更清楚,而且一開始就會呈現出關鍵資訊。
GPT-5.2 Thinking專為更深入的工作而設計,協助使用者處理更複雜的任務,包括製作簡報、試算表及其他檔案,成果更完整細緻。模型在編寫程式碼、摘要長篇文件、回答上傳檔案相關問題、逐步解決數學和邏輯問題,以及協助規劃與決策方面均有明顯進步,回應結構更清晰,提供的細節也更實用。
例如在人力規劃上,輸入提示詞「建立一個人力資源方案模型,納入人員編制、招聘方案、流失率與預算影響。要涵蓋工程、行銷、法務與銷售部門。」即可得到規劃表。
在OpenAI的基準測試圖表中,GPT-5.2 Thinking在幾乎所有列出的推理測試都優於Gemini 3和 Anthropic的Claude Opus 4.5,從實際軟體工程任務(SWE-Bench Pro)和博士級科學知識(GPQA Diamond)到抽象推理和模式發現(ARC-AGI 套件)都是。
GPT-5.2 Pro,根據OpenAI的說法,則是該公司「迄今為止最聰明、最可靠的模型,適合需要高品質答案、且容許較長回應時間的艱深問題」。早期測試顯示,此模型的重大錯誤更少,且在程式設計等複雜領域表現更好。
OpenAI表示,整個ChatGPT-5.2系列在工作和學習方面都比以往版本有顯著提升。OpenAI 產品負責人史瓦澤(Max Schwarzer)表示GPT-5.2 能夠逐步完成複雜的數學和邏輯運算,並引述Windsurf和CharlieCode等程式設計新創公司的報告指稱,GPT-5.2擁有「最先進的AI代理編碼表現」,並且在複雜的多步驟工作流程中取得可衡量的提升。
除了編碼,史瓦澤還指出,GPT-5.2 的「思考」回應比其前代產品減少38%的錯誤,這使得該模型在日常決策、研究和寫作方面更加可靠。
對於開發者而言,ChatGPT-5.2旨在成為強大的建構代理模型,這得益於其在通用智能、長上下文理解、代理式工具調用和視覺方面的改進。CNET說明,在AI和軟體開發領域中,「代理」(agents)是指AI系統中能夠查知使用者輸入等資訊、推理並執行例如運行程式碼或操作軟體等操作。
GPT‑5.2的3款新模型11日起陸續推出,首先開放給付費方案使用者,並已向所有的開發者開放。
OpenAI執行長阿特曼(Sam Altman)上周向員工發出一份內部「紅色警戒」(code red)備忘錄,要求注意來自競爭對手日益增長的威脅,特別是Google及其11月發布的先進聊天機器人Gemini 3。此舉與Google幾年前發布的「紅色警報」備忘錄如出一轍,當時OpenAI發布ChatGPT並引起全球關注。短短幾年間,角色互換,兩家公司現在都將對方視為AI競賽的主要競爭對手。
