Gemini Omni AI 影片生成器

Google 全新的多模態 AI 影片模型，把文字、圖片、音訊與參考片段轉成帶原生音效的影片——現在你可以在 Nano Banana 線上直接使用 Gemini Omni。

提示詞*

0/5000

提示詞*

0/5000

參考圖片 (0/7)

點擊或拖曳圖片到此處

支援 PNG / JPG / WEBP，最多 7 張

單張圖片不超過 10MB

45點數

載入影片任務中……

用 Gemini Omni 你可以做出哪些影片

免拍攝的商品影片與可購物廣告素材

適用於 Shopify、Amazon、Etsy、TikTok Shop 賣家 · DTC 品牌主

模式：圖片生成影片 · 引擎：Gemini Omni · 輸出：8 秒、9:16 / 1:1、原生音效

你手上只有一張商品的棚拍照，預算卻不夠請攝影團隊。今晚下班前必須交出 5 個角度的素材，明天 Meta 與 TikTok 要 A/B 測試。舊的做法是「剪一段幻燈片」；新的做法是一張圖加一句提示詞，產出一段商品轉動、光線變化、自帶環境音樂的短片。參考圖片可以鎖定商品幾何造型，讓同一個 SKU 在不同版本之間保持一致。

提示詞

Studio shot of the product on a marble surface, slow 360-degree turn, soft daylight from the left, subtle ambient music, 8 seconds, 9:16 vertical, cinematic.

跟得上 A/B 測試節奏的廣告素材

適用於付費社群投手 · 成效行銷人員 · 創意總監

模式：文字生成影片 + 多重參考 · 引擎：Gemini Omni · 輸出：8 秒、9:16、原生音效

你正在跑 Meta 或 TikTok 廣告，明天就要 15 個版本，但設計師排程已經滿到下個月。瓶頸從來不是創意——而是每個版本要花多久才能生出來。Gemini Omni 把提示詞到成品的時間從幾天壓到幾分鐘：丟一句鉤子文案、一張商品參考圖、一段配音樣本，就能拿到帶同步音訊的影片，可以直接丟進廣告管理員。改提示詞、重新生成、上架。

提示詞

30-something woman holding [product], looking at camera, sunlit kitchen, voiceover: 'I switched after one week.' 8 seconds, vertical, warm color grade.

角色一致的短影音內容

適用於 TikTok / Reels / YouTube Shorts 創作者 · 無臉頻道 · 迷因帳號

模式：多重參考 · 引擎：Gemini Omni · 輸出：8–15 秒、9:16、原生音效

你經營一個無臉頻道，「主持人」是一個 AI 角色。上週的影片用了參考圖 A，這週要同一個角色、同一套服裝、新場景、新情緒。沒有鎖定身份的參考圖，每支影片看起來都像不同人。Gemini Omni 可以同時載入多個參考素材（角色、服裝、場景、道具、音效），並在整支影片裡保持一致——讓你的系列影片真的看起來像一個系列。

提示詞

[Reference: character.jpg] in a Tokyo arcade at night, neon reflections on her jacket, looking up at the camera, ambient city sound, 10 seconds, vertical.

預覽分鏡、Storyboard 與運鏡模擬

適用於獨立電影工作者 · 動態設計師 · VFX previz · 攝影指導 · 開發影片工具的進階開發者

模式：文字生成影片 + 多重參考 · 引擎：Gemini Omni · 輸出：8–15 秒、16:9、原生音效

你正在向導演提案一場戲，得讓對方在敲定拍攝日之前感受到推鏡的節奏。以前 storyboard 只能用靜態畫面表達；Gemini Omni 直接給你帶聲音的動態畫面。把運鏡寫進提示詞、用參考素材鎖定角色與場景，產出一支花費比一杯咖啡還便宜的預覽分鏡。開發影片工具的獨立開發者也會用同一套流程，在串接 API 之前先測試運鏡邏輯。

提示詞

Wide shot of a lone figure on a coastal cliff at dusk, slow camera push-in, distant wave sound, golden hour lighting, 16:9 cinematic, 10 seconds.

知識解說與概念視覺化

適用於教育工作者 · 線上課程創作者 · YouTube 知識型頻道 · 技術文件作者

模式：文字生成影片 · 引擎：Gemini Omni · 輸出：10–15 秒、16:9、原生音效

你要解釋一個很難用畫的概念——蛋白質摺疊、軌道力學、歷史場景、化學反應。Google 自己在 Omni 的官方示範裡也選了這類題材（黏土風格的蛋白質摺疊），因為這正是多模態影片真正派得上用場的地方：用口語描述一個抽象概念，配一張參考草圖，就能拿到一段學生願意看完的短片。多鏡頭的敘事能讓解說真的「鋪陳」起來，而不是停在一個畫面上。

提示詞

Sequence: a single water droplet falling, splash in slow motion, droplet rejoining a stream, narrated voiceover explaining surface tension, 15 seconds, 16:9.

Gemini Omni 怎麼用

選擇輸入模式

打開上方的生成器面板。如果你只有一個文字構想，就停在「文字生成影片」分頁；如果你已經有商品照、角色設定圖或參考畫面，切到「圖片生成影片」；如果想要最嚴格的身份鎖定（同一個角色、同一套服裝、同一個場景跨多次生成），改用「多重參考」並載入多個參考素材——可以是圖片、短片或音效。

把提示詞當作給導演的拍攝指示來寫

公式是：主體 + 場景 + 光線 + 運鏡 + 音效 + 規格 + 時長。六個欄位。任何一格你留白，模型就會用統計上的平均值補上去。範例：「一位 30 歲女性身穿米色風衣，夜晚走在下著雨的澀谷十字路口，霓虹燈映在濕漉漉的地面上，從後方緩慢跟拍鏡頭，城市環境音與遠處車流聲，9:16 直式、8 秒。」

生成、調整、匯出

設定時長與顯示比例，按下「生成」。算圖時間視設定通常要幾分鐘。出片後你可以直接拿來用，也可以把它當成對話的第一版草稿：改提示詞、換掉一張參考圖、重新生成。匯出格式為帶音訊的 MP4。

常見問題

影片最長可以多長？

目前 Gemini Omni Flash 在 Gemini 應用程式與 Nano Banana 上最長可生成約 10 秒的短片。Google 表示這是部署層面的選擇，不是模型本身的硬性上限，更長的時長正在規劃中。一旦 Google 解除限制，Nano Banana 也會同步放寬。

會自動生成音效嗎？還是只有畫面？

原生音效預設開啟——Gemini Omni 會把同步的旁白、環境音、配樂與畫面一起算出來。如果你想拿到無聲版本（例如要丟進剪輯軟體再配音），可以在面板上關掉音效。

生成的影片可以商用嗎？

在付費方案下，Nano Banana 流程的輸出可商用匯出。免費點數定位是試用評估。詳細條款請看《服務條款》——把成品用到付費廣告活動之前務必先讀過。

可以丟哪些參考素材進去？

多重參考模式支援靜態圖片（角色、服裝、場景、商品、風格畫面）、短的參考影片（運鏡方向、構圖），以及音訊片段（聲線、配樂）。你設定的錨點越多，生成結果就越可控——這在系列內容裡要產出同一個角色的多個版本時特別關鍵。

怎麼樣才能拿到比較接近「Omni 風格」的對話式編輯效果？

保持參考素材不變，每次只改提示詞裡的其中一個欄位（只改光線、或只改運鏡、或只改服裝），然後重新生成。不要把整段提示詞重寫——那會把你已經累積出來的一致性砍掉重來。這就是 Gemini 應用程式對話介面裡那套迭代心法。

怎麼寫提示詞才能拿到自然的運鏡？

三個原則。第一，把運鏡寫清楚——「從後方緩慢跟拍鏡頭」、「固定機位」、「四秒內推鏡」。運鏡描述含糊，產出的運鏡就含糊。第二，給引擎一個物理錨點（一個真實的表面、一個真實的光源、一個物件的重量感）。第三，動作量要跟片長對得上——把 30 秒的動作硬塞進 8 秒，畫面就會抖動。

用 Gemini Omni 需要 Google AI 的訂閱嗎？

不需要。Nano Banana 透過自家的點數系統提供 Gemini Omni 使用權——不需要 Google AI Plus、Pro 或 Ultra 訂閱。新用戶註冊即送免費點數。

Gemini Omni 跟 Veo 有什麼不同？

Veo 是 Google DeepMind 專門的影片模型——在電影感、光線與運鏡上表現很強。Gemini Omni 則是多模態模型，影片只是這同一個模型能處理的多種模態之一，並內建對話式編輯。在 Gemini 應用程式裡，Omni 已經取代 Veo。兩個都可以在 Nano Banana 使用——如果你想要不帶多模態、純粹的電影感輸出，請改用 Veo 生成器。

Gemini Omni 可以做深偽或 AI 虛擬化身嗎？

Gemini Omni 有一個需要主動開通的虛擬化身功能，並設有反深偽防護——使用者必須先錄一段念數字序列的影片，才能用自己生成虛擬化身。針對既有影片的語音編輯功能在模型層級就被擋下，作為安全措施。同一套防護也適用於 Nano Banana 上的 Gemini Omni。