推理AI模型熱潮或將降溫? 分析指一年內恐面臨發展瓶頸 【編譯黃惠瑜/綜合外電】近期各大人工智慧(AI)公司推出的推理模型,包括Google的Gemini 2.0 Flash Thinking、OpenAI的o1和o3-mini、IBM的Granite 3.2,以及中國大陸新創公司「深度求索」(DeepSeek)的R1模型,都使AI推理成為當前AI領域的熱門話題與重要發展方向。不過,根據最新調查結果,推理AI模型的進展最快可能在一年內就會減緩下來。 2025/05/13 15:19 國際 寰宇要聞
DeepSeek再推出新模型 專注數學推理開源大語言模型 【財經中心/台北報導】中國AI新創公司DeepSeek昨在AI開源社區Hugging Face上,發布名為DeepSeek-Prover-V2-671B的新模型,隨後在GitHub等平台上公開相關論文資訊。 2025/05/01 13:10 財經 科技新知
開源LLM盛行!你也能打造自己的AI PC 筆電廠找出新商業模式 【記者李宜儒/台北報導】AI PC在2023年底問世後,各家電腦廠紛紛絞盡腦汁,試想AI可以為電腦使用者有甚麼幫助。在2024年一整年來看,廠商對於AI的應用,還是不脫在筆電使用上的優化。而AI PC在2025年已逐漸成為主流,是否要開發自有的AI軟體也變成筆電廠的選擇題,法人表示,開發各家廠商專屬的LLM(大語言模型)成本極高,同時也不一定適合消費者使用。 2025/03/30 11:30 財經 產業脈動
周末精選|黃仁勳GTC預言資料中心被取代!企業人力加快導入AI 曝2大瓶頸 【編譯于倩若/綜合外電】輝達GTC大會是地表最大AI盛事,黃仁勳上周二(台灣上周三)在輝達GTC主題演講,獲美國科技媒體《siliconANGLE》盛讚「將精湛技術、遠見卓識與幽默感融為一體」,並統整了他在演講中揭露的產業發展6大要點,指黃仁勳用一次演講給未來10年的發展定調。 2025/03/23 19:09 財經 國際焦點
AI產業另一殺手?阿里巴巴推最新AI模型 號稱效能超越DeepSeek-R1 【財經中心/台北報導】阿里巴巴Qwen團隊昨宣布最新研究成果通義千問「QwQ-32B」大語言模型,帶動阿里巴巴股價昨天一度大漲8%,阿里旗下Qwen團隊表示,QwQ-32B是擁有320億參數的模型,其效能可與具備6710億參數(其中370億被啟動)的DeepSeek-R1 媲美。 2025/03/07 09:29 財經 科技新知
黃仁勳在輝達財報會議說了什麼? 6大QA掌握他對AI產業展望 【財經中心/台北報導】輝達今天凌晨公布財報,執行長黃仁勳在財報電話會議上表示,AI正在從感知和生成式AI發展到推理AI,DeepSeek-R1點燃全球的熱情,公司對AI推理帶來的潛在需求感到興奮。 2025/02/27 14:00 財經 產業脈動
OpenAI前技術長創辦新公司 2/3團隊挖角自前東家、Meta頂尖人才 【編譯張翠蘭/綜合外電】美國生成式人工智慧(AI)龍頭OpenAI的前技術長穆拉蒂自立門戶,周二(2/18)宣布創辦新的AI公司,其團隊2/3成員來自前東家OpenAI、法國科技新創Mistral,以及社群龍頭臉書(Facebook)母公司Meta的頂尖研究人員和工程師,號稱將聚焦在比競爭對手更廣泛的AI應用領域。 2025/02/19 10:46 國際 熱搜話題
梁文鋒領軍DeepSeek團隊發表最新論文 可讓AI模型進一步降本增效 【財經中心/台北報導】中國AI新創公司DeepSeek爆紅後,團隊近日發表一篇論文,介紹一種新的注意力機制NSA(Natively Sparse Attention,原生稀疏注意力機制)。 2025/02/19 07:30 財經 科技新知
訓練成本不到2000元 美AI研究人員打造出媲美OpenAI o1的推理模型 【編譯黃惠瑜/綜合外電】訓練人工智慧(AI)模型似乎越來越便宜。美國史丹佛大學和華盛頓大學的AI研究員日前發表論文指出,他們以不到50美元(約1641元台幣)的雲端運算費用,成功訓練出一個AI「推理」模型s1,s1在數學與編碼能力測試的表現可與OpenAI o1和近期爆紅的中國大陸新創公司「深度求索」(DeepSeek)R1模型相媲美。 2025/02/06 21:29 國際 寰宇要聞
懶人包|DeepSeek是「輝達殺手」或被高估了? 4個Q&A快速掌握 【編譯于倩若/綜合外電】中國大陸DeepSeek更便宜、更有效率的AI(人工智慧)模式的前景,在周一震撼了市場和產業,DeepSeek是輝達(Nvidia)殺手還是被高估了?《NIKKEI Asia》整理4大Q&A帶你快速掌握。 2025/01/29 11:44 財經 產業脈動