spot_img

OpenAI與Google競爭升溫:下一代模型大戰

文/張杰倫

谷歌 Gemini 流量暴增逾六倍,GPT‑5.4 與 Gemini 2.5 雙雄相爭——市場已從“一家獨大”進入“雙雄爭霸”,但真正的勝負手或許已不在模型本身。

2026 年春天的 AI 賽場,比以往任何時候都更像一場沒有劇本的拳擊賽。Google 在 3 月毫無預警地甩出 Gemini 2.5 系列,用 100 萬 token 的上下文窗口和遠低於對手的定價直接砸向開發者社區;而 OpenAI 則在同一個月以 GPT‑5.4 回敬,首款原生具備頂尖計算機使用能力的通用大模型正式落地全平台。雙方幾乎在同一時間祭出各自的新王牌,市場的反應也相當直接:Gemini 的獨立訪客市佔率從 2025 年 8 月的 13.8% 倍增至逾 27%,而 ChatGPT 的流量份額則從絕對壟斷的 86.7% 滑落至約 64.5%。生成式 AI 的牌桌上,不再是 OpenAI 一個人在玩。

Google 的 Gemini 2.5 Pro 選擇了最直接的方式打動開發者——價格和上下文。輸入 3.5 美元/百萬 token,輸出 10.5 美元,比 Claude 3.7 便宜 40%,比 GPT‑4.5 便宜 80%。與此同時,100 萬 token 的上下文窗口讓開發者可以直接把一個中型企業的代碼庫整個塞進模型,不需要切片,不需要 RAG,直接問。這種“量大管飽”的策略在 Gemini 2.5 Flash 和 Flash-Lite 上被進一步放大,後者輸入僅 0.1 美元/百萬 token,處理 10 萬字文本成本不過幾毛錢。Google 顯然在複製其搜索引擎時代的打法:用極致的性價比壓低市場門檻,再靠生態綁定留住用戶。

OpenAI 的應對則更偏向技術縱深。GPT‑5.4 系列不僅支持 1M token 上下文,更重要的是具備了原生計算機使用能力——能夠識別截圖中的界面元素,直接模擬鼠標和鍵盤操作跨軟件完成任務。在基準測試中,GPT‑5.4 在 83% 的 GDPval 對比中達到或超過行業專業人員的水平,事實準確性也較前代顯著提升。與此同時,一份流出的內部備忘錄顯示,OpenAI 已規劃代號為“Spud”的全新模型,採用英偉達 Blackwell 芯片訓練,將對標 Anthropic 的 Claude Mythos,並推動核心產品向“超級應用”方向演進。

如果將目光放長遠,兩家公司正在走向完全不同的技術路線。Google 押注的是“規模化智能”——通過超長上下文窗口和極低成本,讓模型在更大範圍內覆蓋開發者和企業需求。Deep Think 模式允許模型在複雜問題前“先思考後回答”,本質上是在提升推理深度的同時,盡可能不犧牲響應速度。OpenAI 則更強調“操作化智能”——讓模型不僅理解世界,還能直接改變世界。GPT‑5.4 的計算機使用能力、內置的 Agent 工作流支持,以及內部正在構建的 Frontier Agent 平台,都指向同一個方向:讓 AI 從“回答問題”轉向“完成任務”。

這兩種思路的分野,本質上反映了兩家公司的基因差異。Google 出身搜索,擅長的是連接信息;OpenAI 瞄准 AGI,追求的是自主行動的能力。而它們共同的對手 Anthropic,正在用 Claude Mythos 在預測市場上以 65% 的隱含概率領跑“最佳模型”競賽。這意味著 2026 年的競爭不再是簡單的“誰更強”,而是“誰能先跑通一個完整的商業閉環”。

一個容易被忽略的信號是:OpenAI 正在借監管之手叩擊 Google 的搜索命門。今年 3 月,OpenAI 正式向英國監管機構提交申請,要求將 ChatGPT 納入安卓系統和 Chrome 瀏覽器的可選默認搜索引擎名單。表面上是反壟斷博弈,背後卻是 OpenAI 對“AI 就是新搜索”這一命題的押注——如果用戶獲取信息的方式已從“關鍵詞檢索”轉向“對話式交互”,那麼搜索引擎的定義本身就需要被改寫。Google 顯然意識到了這一威脅。儘管其搜索收入在 2025 年仍增長了 16%,但 Gemini 的快速擴張某種程度上也是一場自我革命:與其讓別人顛覆搜索,不如自己先顛覆自己。

下一個階段的關鍵詞將是“平台化”與“生態鎖定”。OpenAI 的備忘錄明確提到,單純依靠模型性能已難以打動企業客戶,市場正進入更成熟的階段,企業更關注 AI 如何嵌入既有工作流程。為此,OpenAI 正在構建名為“Frontier”的 Agent 平台,目標成為企業級智能體的“默認基礎設施”。而 Google 的優勢則在於其龐大的安卓和 Workspace 生態,Gemini 已經可以無縫調用 Docs、Gmail 和 Drive 中的文件,無需複製粘貼。

這場戰爭遠未結束,但它已經變了。當 GPT‑5.4 學會用鼠標點擊屏幕、當 Gemini 2.5 以幾毛錢的成本處理一整本小說的內容,真正值得關注的或許不再是“誰在榜單上多贏了幾個百分點”,而是誰能在用戶的日常工作流中佔據那個不可替代的位置。