
記者張杰倫報導
科技的發展在2026年迎來了全新突破,Google 在近期的技術發表中正式推出了令人震撼的全新影片生成模型「Gemini Omni」,為AI創作與數位分身技術注入了前所未有的強大動能。這次的更新打破了過去影像生成的諸多痛點,讓科技與影音創作的結合更加密不可分。
本次六月份最受矚目的核心亮點首推「全模態輸入」的影片生成功能。過去創作者在製作 AI 影片時,最害怕遇到的就是一旦轉換視覺風格,人物的五官與精細度就完全「崩掉」,或是更換場景時聲音隨之失真。然而,全新的 Gemini Omni 徹底解決了這個問題。用戶現在只需要提供一段 10 秒以內的短影片,系統就能完美捕捉並保留主角的聲音、形體輪廓與面部五官表情。
更厲害的是,Gemini Omni 內建了包含動漫、賽博朋克、油畫、3D 復古未來以及電影感等 18 種不同的視覺風格模板。創作者只需輸入極為簡單的提示詞,例如將原本在室內拍攝的畫面改為「穿著月球太空裝、背景置換成月球」,AI 就能在短短幾分鐘內,生成出視角流暢、風格統一且連音調細節都完美複製的全新高質感影片。
除了強大的風格置換,這次更新還推出了實用的「分鏡指令生成」功能。用戶能夠依照一連串複雜且精細的分鏡分秒進行設定,明確指示人物每一秒的動作與鏡頭的推移。雖然在目前的測試中,偶爾仍會出現背景細節微幅遺失(例如畫面中的物件在最後鏡頭不小心消失)的小抽卡現象,但其高精準度的動作還原度,已經大幅縮短了過往需要數小時的影片後製工程。
另一大驚豔功能則是「Gemini Avatar」數位分身建立。這項功能目前採取了相當嚴格的真人安全驗證流程,用戶必須透過手機進行自拍、轉頭等多角度捕捉以確保為真人創建。建立完成後,AI 即可生成長時段且高穩定度的虛擬分身。不過這項最新功能也有其門檻與限制:首先,用戶必須是付費訂閱版的進階會員;其次,目前的系統界面需切換成英文才可開啟,且數位分身目前僅支援英文發音;最後在生成的額度上,付費版一天也有限制次數。
儘管目前的數位分身在嘴型與部分說話的語調上,仍帶有一絲微妙的推論與擬真感,但整體臉部細節與長時段畫面穩定度已大幅超越過往的 Sora 等模型。這項技術的普及,象徵著未來創作者可能不再需要事事親自錄影,只要透過精準的科技工具,就能開啟無限延伸的創作新紀元。

