Gemini Omni AI 동영상 생성기

구글의 새로운 멀티모달 AI 동영상 모델이 텍스트·이미지·오디오·참조 클립을 네이티브 오디오가 포함된 동영상으로 만들어 줍니다 — 이제 Nano Banana에서 Gemini Omni를 온라인으로 바로 실행해 보세요.

프롬프트*

0/5000

프롬프트*

0/5000

참조 이미지 (0/7)

이미지를 클릭하거나 여기에 드롭하세요

PNG / JPG / WEBP, 최대 7장

이미지당 최대 10MB

45크레딧

동영상 작업 불러오는 중...

Gemini Omni로 만들 수 있는 것들

촬영이 필요 없는 제품 영상과 쇼퍼블 광고

Shopify, Amazon, Etsy, TikTok Shop 셀러 · DTC 브랜드용

모드: Image-to-Video · 엔진: Gemini Omni · 출력: 8초, 9:16 / 1:1, 네이티브 오디오

제품 스튜디오 컷 한 장과 영상 팀을 부를 여유가 없는 예산만 있는 상황. 내일 Meta와 TikTok에서 A/B 테스트를 돌려야 해서 오늘 안에 5가지 앵글이 필요합니다. 예전 방식은 "슬라이드쇼 편집"이었다면, 새로운 방식은 이미지 한 장 + 프롬프트 하나 → 제품이 회전하고 조명이 움직이며 앰비언트 사운드가 깔린 짧은 클립입니다. 참조 사진은 렌더링마다 제품의 형태를 고정시켜, 어떤 변형 영상에서도 같은 SKU가 같은 SKU로 유지되도록 해 줍니다.

프롬프트

Studio shot of the product on a marble surface, slow 360-degree turn, soft daylight from the left, subtle ambient music, 8 seconds, 9:16 vertical, cinematic.

A/B 테스트 속도에 맞춘 광고 크리에이티브

유료 소셜 미디어 바이어 · 퍼포먼스 마케터 · 크리에이티브 리드용

모드: Text-to-Video + Multi Reference · 엔진: Gemini Omni · 출력: 8초, 9:16, 네이티브 오디오

Meta나 TikTok 광고를 테스트 중인데 디자이너가 한 달 내내 일정이 꽉 차 있어서 내일까지 15개 변형이 필요한 상황. 병목은 한 번도 아이디어인 적이 없었습니다 — 각 변형을 렌더링하는 데 걸리는 시간이 문제였죠. Gemini Omni는 프롬프트에서 변형까지의 시간을 며칠에서 몇 분으로 단축합니다: 후크 카피, 제품 참조 이미지, 보이스오버 샘플을 넣으면 오디오가 동기화된 클립이 나와 바로 광고 관리자에 넣을 수 있습니다. 프롬프트를 다듬고, 다시 생성하고, 출고하세요.

프롬프트

30-something woman holding [product], looking at camera, sunlit kitchen, voiceover: 'I switched after one week.' 8 seconds, vertical, warm color grade.

일관된 캐릭터가 등장하는 숏폼 콘텐츠

TikTok / Reels / YouTube Shorts 크리에이터 · 페이스리스 채널 · 밈 계정용

모드: Multi Reference · 엔진: Gemini Omni · 출력: 8–15초, 9:16, 네이티브 오디오

페이스리스 채널을 운영 중이고 "호스트" 역할은 AI 캐릭터가 맡고 있습니다. 지난주 영상은 참조 이미지 A를 썼고, 이번 주는 같은 캐릭터, 같은 의상에 새로운 장면, 새로운 감정이 필요합니다. 아이덴티티가 고정된 참조 없이는 매 영상마다 다른 사람처럼 보이게 됩니다. Gemini Omni는 여러 참조(캐릭터·의상·장소·소품·오디오 베드)를 불러와 클립 전반에 걸쳐 일관되게 유지합니다 — 그래서 시리즈가 정말 시리즈처럼 느껴집니다.

프롬프트

[Reference: character.jpg] in a Tokyo arcade at night, neon reflections on her jacket, looking up at the camera, ambient city sound, 10 seconds, vertical.

프리비주얼라이제이션, 스토리보드, 모션 목업

인디 영화감독 · 모션 디자이너 · VFX 프리비즈 · 촬영감독 · 영상 도구를 만드는 개발자용

모드: Text-to-Video + Multi Reference · 엔진: Gemini Omni · 출력: 8–15초, 16:9, 네이티브 오디오

한 장면을 피칭하면서 촬영 일정을 잡기 전에 감독에게 돌리인(dolly-in)이 어떤 느낌인지 보여주고 싶을 때. 예전 스토리보드는 정지 프레임으로 이걸 했지만, Gemini Omni는 사운드와 함께 움직이는 프레임으로 보여줍니다. 카메라 무빙은 프롬프트에 잠그고, 캐릭터·장소는 참조로 잠근 다음, 커피 미팅보다 저렴한 비용으로 시청 가능한 프리비즈 릴을 출고하세요. 영상 도구를 만드는 인디 개발자도 API 통합을 결정하기 전에 모션 동작을 프로토타이핑할 때 같은 루프를 사용합니다.

프롬프트

Wide shot of a lone figure on a coastal cliff at dusk, slow camera push-in, distant wave sound, golden hour lighting, 16:9 cinematic, 10 seconds.

설명 영상과 개념 시각화

교육자 · 강의 제작자 · YouTube 에듀테인먼트 · 기술 작가용

모드: Text-to-Video · 엔진: Gemini Omni · 출력: 10–15초, 16:9, 네이티브 오디오

그리기 어려운 개념을 설명해야 할 때 — 단백질 접힘, 궤도 역학, 역사적 장면, 화학 반응. 구글 자체 Omni 데모도 이 용도(클레이메이션 스타일의 단백질 접힘)에 무게를 실었습니다. 멀티모달 영상이 진가를 발휘하는 지점이 바로 여기이기 때문입니다: 추상적인 아이디어를 평범한 말로 묘사하고, 참조 스케치로 시각적 앵커를 잡으면, 학생이 실제로 끝까지 볼 만한 짧은 클립이 돌아옵니다. 멀티샷 스토리텔링 덕분에 설명 영상이 한 프레임에 머물지 않고 전개될 수 있습니다.

프롬프트

Sequence: a single water droplet falling, splash in slow motion, droplet rejoining a stream, narrated voiceover explaining surface tension, 15 seconds, 16:9.

Gemini Omni 사용 방법

시작할 입력 방식을 선택하세요

위의 생성기 위젯을 엽니다. 텍스트 아이디어만 있다면 Text-to-Video 탭에 머무세요. 제품 사진, 캐릭터 시트, 참조 프레임이 있다면 Image-to-Video로 전환하세요. 가장 엄격한 아이덴티티 고정(렌더링마다 같은 캐릭터, 같은 의상, 같은 장소)을 원한다면 Multi Reference를 사용하고 여러 참조 에셋 — 이미지, 짧은 클립, 오디오 베드 — 을 불러오세요.

감독에게 브리핑하듯 프롬프트를 작성하세요

패턴은 이렇습니다: 주체 + 배경 + 조명 + 카메라 무빙 + 오디오 + 포맷 + 길이. 슬롯 여섯 개. 어느 하나라도 비워두면 모델이 평균적인 값으로 알아서 채웁니다. 예: "30대 여성, 베이지 트렌치코트 차림으로 비 내리는 밤의 시부야 교차로를 걸음, 젖은 보도에 비치는 네온 반사, 뒤에서 따라가는 슬로우 트래킹 샷, 도시의 앰비언트 사운드와 멀리서 들리는 차 소리, 9:16 세로, 8초."

생성·다듬기·내보내기

길이와 화면 비율을 설정하고 Generate를 누르세요. 렌더링은 보통 설정에 따라 몇 분 정도 걸립니다. 결과가 나오면 그대로 출고하거나, 채팅 대화의 초안처럼 다루어도 됩니다: 프롬프트를 다듬고, 참조 하나를 바꾸고, 다시 생성하세요. 오디오를 포함한 MP4로 내보냅니다.

자주 묻는 질문

영상 길이는 얼마나 되나요?

Gemini Omni Flash는 현재 Gemini 앱과 Nano Banana에서 약 10초까지의 클립을 렌더링합니다. 구글은 이것이 모델의 절대적인 한계가 아니라 배포 단계의 선택이며, 더 긴 길이가 준비 중이라고 밝혔습니다. 구글이 제한을 풀면 Nano Banana도 곧바로 따라갑니다.

사운드가 같이 생성되나요, 아니면 무음 영상인가요?

네이티브 오디오가 기본으로 켜져 있습니다 — Gemini Omni는 동기화된 보이스오버, 앰비언트 사운드, 음악을 같은 렌더링의 일부로 만들어 냅니다. NLE에서 편집할 무음 클립이 필요하다면 위젯에서 오디오를 끄세요.

출력물을 상업적으로 사용할 수 있나요?

Nano Banana 워크플로의 출력물은 유료 플랜에서 상업적 용도로 내보낼 수 있습니다. 무료 크레딧은 평가용입니다. 구체적인 약관은 이용 약관에 있으니, 유료 캠페인에 출력물을 사용하기 전에 꼭 확인하세요.

어떤 종류의 참조를 넣을 수 있나요?

Multi Reference 모드는 정지 이미지(캐릭터·의상·장소·제품·스타일 프레임), 짧은 참조 영상(모션 방향·프레이밍), 오디오 클립(보이스 톤·음악 베드)을 받을 수 있습니다. 앵커를 많이 설정할수록 렌더링이 예측 가능해집니다 — 시리즈 전반에 걸쳐 같은 캐릭터의 변형 영상을 만들 때 특히 중요합니다.

더 "Omni답게" 대화형 편집을 하려면 어떻게 해야 하나요?

같은 참조 에셋을 그대로 두고, 프롬프트의 한 슬롯만 한 번에 바꾸세요(조명만, 또는 카메라 무빙만, 또는 의상만 변경) — 그 다음에 다시 생성합니다. 프롬프트 전체를 다시 쓰고 싶은 충동은 참으세요 — 그러면 그동안 쌓아온 일관성이 리셋됩니다. 이것이 Gemini 앱 채팅 인터페이스에서 작동하는 것과 똑같은 반복 방식입니다.

사실적인 모션을 만드는 프롬프트는 어떻게 작성하나요?

세 가지 원칙. 첫째, 카메라 무빙을 명시적으로 이름 지으세요 — "뒤에서 따라가는 슬로우 트래킹 샷", "고정된 정적 프레임", "4초에 걸친 돌리인". 모호한 모션 표현은 모호한 모션을 만듭니다. 둘째, 장면에 물리적인 앵커를 주세요(실제 표면, 실제 광원, 실제 사물의 무게). 셋째, 시간 스케일을 클립 길이에 맞추세요 — 30초 분량의 액션을 8초에 욱여넣으면 떨림으로 렌더링됩니다.

여기서 Gemini Omni를 쓰려면 Google AI 구독이 필요한가요?

아니요. Nano Banana는 자체 크레딧 시스템을 통해 Gemini Omni 접근을 제공합니다 — Google AI Plus, Pro, Ultra 구독이 필요 없습니다. 신규 사용자에게는 가입 시 무료 크레딧이 지급됩니다.

Gemini Omni와 Veo의 차이는 무엇인가요?

Veo는 구글 딥마인드의 전용 영상 모델로 — 시네마틱 룩, 조명, 카메라 무빙에 강합니다. Gemini Omni는 같은 모델이 여러 입력을 다루는 멀티모달 모델이며, 그중 하나가 영상 출력이고 대화형 편집이 기본으로 들어 있습니다. Gemini 앱 내부에서는 Omni가 Veo를 대체합니다. Nano Banana에서는 둘 다 사용할 수 있습니다 — 멀티모달 레이어 없이 순수 시네마틱 출력을 원한다면 Veo 생성기를 확인하세요.

Gemini Omni가 딥페이크나 AI 아바타를 만들 수 있나요?

Gemini Omni에는 안티 딥페이크 가드레일이 포함된 옵트인 아바타 기능이 있습니다 — 사용자는 자신을 아바타로 생성할 수 있게 되기 전에 일련의 숫자를 읽는 영상을 녹화해야 합니다. 기존 영상의 음성을 편집하는 기능은 안전 조치로 모델 단계에서 막혀 있습니다. Nano Banana에서 Gemini Omni를 사용할 때도 같은 가드레일이 적용됩니다.