🎁新使用者註冊即可獲得免費積分

Gemini Omni AI 影片生成器

Google 全新的多模態 AI 影片模型,把文字、圖片、音訊與參考片段轉成帶原生音效的影片——現在你可以在 Nano Banana 線上直接使用 Gemini Omni。

0/5000
0/5000

點擊或拖曳圖片到此處

支援 PNG / JPG / WEBP,最多 7 張

單張圖片不超過 10MB

45點數

載入影片任務中……

用 Gemini Omni 你可以做出哪些影片

免拍攝的商品影片與可購物廣告素材

適用於 Shopify、Amazon、Etsy、TikTok Shop 賣家 · DTC 品牌主

模式:圖片生成影片 · 引擎:Gemini Omni · 輸出:8 秒、9:16 / 1:1、原生音效

你手上只有一張商品的棚拍照,預算卻不夠請攝影團隊。今晚下班前必須交出 5 個角度的素材,明天 Meta 與 TikTok 要 A/B 測試。舊的做法是「剪一段幻燈片」;新的做法是一張圖加一句提示詞,產出一段商品轉動、光線變化、自帶環境音樂的短片。參考圖片可以鎖定商品幾何造型,讓同一個 SKU 在不同版本之間保持一致。

提示詞
Studio shot of the product on a marble surface, slow 360-degree turn, soft daylight from the left, subtle ambient music, 8 seconds, 9:16 vertical, cinematic.

跟得上 A/B 測試節奏的廣告素材

適用於付費社群投手 · 成效行銷人員 · 創意總監

模式:文字生成影片 + 多重參考 · 引擎:Gemini Omni · 輸出:8 秒、9:16、原生音效

你正在跑 Meta 或 TikTok 廣告,明天就要 15 個版本,但設計師排程已經滿到下個月。瓶頸從來不是創意——而是每個版本要花多久才能生出來。Gemini Omni 把提示詞到成品的時間從幾天壓到幾分鐘:丟一句鉤子文案、一張商品參考圖、一段配音樣本,就能拿到帶同步音訊的影片,可以直接丟進廣告管理員。改提示詞、重新生成、上架。

提示詞
30-something woman holding [product], looking at camera, sunlit kitchen, voiceover: 'I switched after one week.' 8 seconds, vertical, warm color grade.

角色一致的短影音內容

適用於 TikTok / Reels / YouTube Shorts 創作者 · 無臉頻道 · 迷因帳號

模式:多重參考 · 引擎:Gemini Omni · 輸出:8–15 秒、9:16、原生音效

你經營一個無臉頻道,「主持人」是一個 AI 角色。上週的影片用了參考圖 A,這週要同一個角色、同一套服裝、新場景、新情緒。沒有鎖定身份的參考圖,每支影片看起來都像不同人。Gemini Omni 可以同時載入多個參考素材(角色、服裝、場景、道具、音效),並在整支影片裡保持一致——讓你的系列影片真的看起來像一個系列。

提示詞
[Reference: character.jpg] in a Tokyo arcade at night, neon reflections on her jacket, looking up at the camera, ambient city sound, 10 seconds, vertical.

預覽分鏡、Storyboard 與運鏡模擬

適用於獨立電影工作者 · 動態設計師 · VFX previz · 攝影指導 · 開發影片工具的進階開發者

模式:文字生成影片 + 多重參考 · 引擎:Gemini Omni · 輸出:8–15 秒、16:9、原生音效

你正在向導演提案一場戲,得讓對方在敲定拍攝日之前感受到推鏡的節奏。以前 storyboard 只能用靜態畫面表達;Gemini Omni 直接給你帶聲音的動態畫面。把運鏡寫進提示詞、用參考素材鎖定角色與場景,產出一支花費比一杯咖啡還便宜的預覽分鏡。開發影片工具的獨立開發者也會用同一套流程,在串接 API 之前先測試運鏡邏輯。

提示詞
Wide shot of a lone figure on a coastal cliff at dusk, slow camera push-in, distant wave sound, golden hour lighting, 16:9 cinematic, 10 seconds.

知識解說與概念視覺化

適用於教育工作者 · 線上課程創作者 · YouTube 知識型頻道 · 技術文件作者

模式:文字生成影片 · 引擎:Gemini Omni · 輸出:10–15 秒、16:9、原生音效

你要解釋一個很難用畫的概念——蛋白質摺疊、軌道力學、歷史場景、化學反應。Google 自己在 Omni 的官方示範裡也選了這類題材(黏土風格的蛋白質摺疊),因為這正是多模態影片真正派得上用場的地方:用口語描述一個抽象概念,配一張參考草圖,就能拿到一段學生願意看完的短片。多鏡頭的敘事能讓解說真的「鋪陳」起來,而不是停在一個畫面上。

提示詞
Sequence: a single water droplet falling, splash in slow motion, droplet rejoining a stream, narrated voiceover explaining surface tension, 15 seconds, 16:9.

Gemini Omni 怎麼用

1

選擇輸入模式

打開上方的生成器面板。如果你只有一個文字構想,就停在「文字生成影片」分頁;如果你已經有商品照、角色設定圖或參考畫面,切到「圖片生成影片」;如果想要最嚴格的身份鎖定(同一個角色、同一套服裝、同一個場景跨多次生成),改用「多重參考」並載入多個參考素材——可以是圖片、短片或音效。

2

把提示詞當作給導演的拍攝指示來寫

公式是:主體 + 場景 + 光線 + 運鏡 + 音效 + 規格 + 時長。六個欄位。任何一格你留白,模型就會用統計上的平均值補上去。範例:「一位 30 歲女性身穿米色風衣,夜晚走在下著雨的澀谷十字路口,霓虹燈映在濕漉漉的地面上,從後方緩慢跟拍鏡頭,城市環境音與遠處車流聲,9:16 直式、8 秒。」

3

生成、調整、匯出

設定時長與顯示比例,按下「生成」。算圖時間視設定通常要幾分鐘。出片後你可以直接拿來用,也可以把它當成對話的第一版草稿:改提示詞、換掉一張參考圖、重新生成。匯出格式為帶音訊的 MP4。

常見問題

1

影片最長可以多長?

目前 Gemini Omni Flash 在 Gemini 應用程式與 Nano Banana 上最長可生成約 10 秒的短片。Google 表示這是部署層面的選擇,不是模型本身的硬性上限,更長的時長正在規劃中。一旦 Google 解除限制,Nano Banana 也會同步放寬。

2

會自動生成音效嗎?還是只有畫面?

原生音效預設開啟——Gemini Omni 會把同步的旁白、環境音、配樂與畫面一起算出來。如果你想拿到無聲版本(例如要丟進剪輯軟體再配音),可以在面板上關掉音效。

3

生成的影片可以商用嗎?

在付費方案下,Nano Banana 流程的輸出可商用匯出。免費點數定位是試用評估。詳細條款請看《服務條款》——把成品用到付費廣告活動之前務必先讀過。

4

可以丟哪些參考素材進去?

多重參考模式支援靜態圖片(角色、服裝、場景、商品、風格畫面)、短的參考影片(運鏡方向、構圖),以及音訊片段(聲線、配樂)。你設定的錨點越多,生成結果就越可控——這在系列內容裡要產出同一個角色的多個版本時特別關鍵。

5

怎麼樣才能拿到比較接近「Omni 風格」的對話式編輯效果?

保持參考素材不變,每次只改提示詞裡的其中一個欄位(只改光線、或只改運鏡、或只改服裝),然後重新生成。不要把整段提示詞重寫——那會把你已經累積出來的一致性砍掉重來。這就是 Gemini 應用程式對話介面裡那套迭代心法。

6

怎麼寫提示詞才能拿到自然的運鏡?

三個原則。第一,把運鏡寫清楚——「從後方緩慢跟拍鏡頭」、「固定機位」、「四秒內推鏡」。運鏡描述含糊,產出的運鏡就含糊。第二,給引擎一個物理錨點(一個真實的表面、一個真實的光源、一個物件的重量感)。第三,動作量要跟片長對得上——把 30 秒的動作硬塞進 8 秒,畫面就會抖動。

7

用 Gemini Omni 需要 Google AI 的訂閱嗎?

不需要。Nano Banana 透過自家的點數系統提供 Gemini Omni 使用權——不需要 Google AI Plus、Pro 或 Ultra 訂閱。新用戶註冊即送免費點數。

8

Gemini Omni 跟 Veo 有什麼不同?

Veo 是 Google DeepMind 專門的影片模型——在電影感、光線與運鏡上表現很強。Gemini Omni 則是多模態模型,影片只是這同一個模型能處理的多種模態之一,並內建對話式編輯。在 Gemini 應用程式裡,Omni 已經取代 Veo。兩個都可以在 Nano Banana 使用——如果你想要不帶多模態、純粹的電影感輸出,請改用 Veo 生成器。

9

Gemini Omni 可以做深偽或 AI 虛擬化身嗎?

Gemini Omni 有一個需要主動開通的虛擬化身功能,並設有反深偽防護——使用者必須先錄一段念數字序列的影片,才能用自己生成虛擬化身。針對既有影片的語音編輯功能在模型層級就被擋下,作為安全措施。同一套防護也適用於 Nano Banana 上的 Gemini Omni。