AI算力軍備競賽轉向 Google主攻軟硬體生態系、OpenAI強調準確度與可靠性
隨著Google於11月釋出Gemini 3、OpenAI上週推出GPT-5.2模型,這場全球矚目的AI之爭,已從單純的算力軍備競賽轉向截然不同的2條路線。Google全力押寶龐大的軟硬體生態系,試圖讓AI無所不在;OpenAI選擇強調準確度與可靠性,主打「幻覺」更少,解決企業痛點。
Gemini 3從「對話者」進化為「代理人」
Gemini 3最大的變革在於從「對話者」進化為「代理人」(Agent,指AI能主動替使用者操作軟體執行複雜任務)。透過與Android作業系統及Workspace雲端辦公協作平台的深度整合,Gemini 3不再需要使用者複製貼上文字,而是能直接讀取行事曆、郵件與地圖資訊,主動完成任務。
例如,使用者只需要一句「幫我規劃下週去京都的行程並訂房」,Gemini 3就會自行交叉比對機票價格、查詢飯店空房,甚至直接在第三方App中完成預訂。
為了支撐這種高頻率互動,Gemini 3採用更高效的「混合專家」(Mixture of Experts)模型架構,允許系統根據輸入資料自動決定調用擅長處理圖像或語言的專家模型。這意味著頂級模型不再強調「全能選手」,而是組合不同專家一起打「團體戰」。
Google暨Alphabet執行長皮查伊(Sundar Pichai)日前在一場訪談中提到,Gemini 3模型清楚體現Google的「AI優先」策略,正在提升從Google搜尋、YouTube、雲端到Waymo自動駕駛的所有產品。
Google新一代AI模型Gemini 3具備超越博士級的推理能力,在發布首日就導入Google搜尋的「AI模式」,能更精準理解用戶查詢背後的意圖與細節。(Google提供)
OpenAI GPT‑5.2準確度比以往模型更高
相較於Google的廣度,OpenAI的GPT-5.2展現驚人的深度,在處理邏輯推理、寫程式及醫療文獻分析時,展現更高的準確度。OpenAI宣稱,GPT-5.2 Thinking版本的「幻覺」(指AI生成內容中看似合理但錯誤的資訊)比GPT‑5.1 Thinking減少38%,這代表新模型在日常知識工作中更加可靠。
除了專業級模型GPT-5.2 Thinking之外,OpenAI還推出另外2個版本。其中,GPT‑5.2 Instant定位為快速的日常工作與學習工具,在資訊查詢、操作指南、逐步說明、技術寫作與翻譯方面皆明顯提升,準確度比以往模型更高。
另一個版本GPT‑5.2 Pro則適合需要高品質答案、且容許較長回應時間的高難度問題,模型準確度更高、重大錯誤更少,在程式設計等複雜領域表現更好。
在GPT-5.2發表之際,OpenAI執行長阿特曼(Sam Altman)11日於官網發表一篇名為「10年」(Ten years)的文章,回顧OpenAI自10年前創立以來的發展史。
他表示,OpenAI推出GPT-4後關注度大增,突然之間,AGI(通用人工智慧)不再是一件瘋狂的事情。過去3年極度緊張,充滿壓力和沉重的責任,這項技術以前所未有的規模和速度融入世界。
「再過10年,我相信我們幾乎可以肯定能建立超級智慧(superintelligence)」,阿特曼說,從某種意義上來看,日常生活和人們最關心的事情幾乎不會改變,但就另一種意義而言,2035年的人類將能夠做一些現在很難想像的事情。
專精AI的iKala共同創辦人暨執行長程世嘉日前在臉書(Facebook)發文分享看法指出,OpenAI正在主打企業用戶,然而B2B(企業對企業)生意在目前的資本市場環境下,投資人想看到的是證明獲利能力,「這就是接下來OpenAI要面臨的資源拉扯。」(中央社)
