منشئ الفيديو بالذكاء الاصطناعي Gemini Omni

نموذج Google الجديد متعدد الوسائط لتوليد الفيديو يحوّل النصوص والصور والصوت ومقاطع المرجع إلى فيديو بصوت أصلي — والآن يمكنك تشغيل Gemini Omni عبر الإنترنت مع Nano Banana.

الوصف*

0/5000

الوصف*

0/5000

الصور المرجعية (0/7)

انقر أو اسحب الصور إلى هنا

PNG / JPG / WEBP، حتى 7 صور

حجم كل صورة لا يتجاوز 10MB

45نقاط

جارٍ تحميل مهام الفيديو...

ما الذي يمكنك صنعه باستخدام Gemini Omni

فيديوهات المنتجات والإعلانات القابلة للتسوّق دون الحاجة إلى تصوير

لبائعي Shopify وAmazon وEtsy وTikTok Shop · العلامات التجارية الموجّهة للمستهلك

النمط: صورة إلى فيديو · المحرك: Gemini Omni · المخرج: 8 ث، 9:16 / 1:1، صوت أصلي

لديك صورة استوديو واحدة للمنتج وميزانية لا تكفي لطاقم تصوير فيديو. تحتاج إلى 5 زوايا بحلول نهاية اليوم حتى يتمكن Meta وTikTok من اختبارها A/B غدًا. كانت طريقة العمل القديمة هي "تحرير عرض شرائح"؛ الطريقة الجديدة هي صورة واحدة + وصف واحد → مقطع قصير بدوران المنتج وتغيّر الإضاءة وطبقة صوت محيطة مدمجة. تثبّت الصور المرجعية هندسة المنتج عبر عمليات التوليد لتبقى وحدة SKU نفسها متطابقة عبر المتغيّرات.

الوصف

Studio shot of the product on a marble surface, slow 360-degree turn, soft daylight from the left, subtle ambient music, 8 seconds, 9:16 vertical, cinematic.

إبداعات إعلانية بسرعة اختبار A/B

لمشتري الإعلانات المدفوعة على وسائل التواصل · مسوّقي الأداء · قادة الفرق الإبداعية

النمط: نص إلى فيديو + مراجع متعددة · المحرك: Gemini Omni · المخرج: 8 ث، 9:16، صوت أصلي

أنت تختبر إعلانًا على Meta أو TikTok وتحتاج إلى 15 متغيّرًا بحلول الغد لأن مصمّمك محجوز للشهر القادم. لم تكن الفكرة هي عنق الزجاجة أبدًا — بل الوقت الذي يستغرقه كل متغيّر للتوليد. يقلّص Gemini Omni الوقت من الوصف إلى المتغيّر من أيام إلى دقائق: أضف جملة جذب، وصورة مرجعية للمنتج، وعيّنة تعليق صوتي، ويخرج لك مقطع بصوت متزامن جاهز للإضافة إلى Ads Manager. حسّن الوصف، أعِد التوليد، انشر.

الوصف

30-something woman holding [product], looking at camera, sunlit kitchen, voiceover: 'I switched after one week.' 8 seconds, vertical, warm color grade.

محتوى قصير بشخصيات ثابتة

لصنّاع TikTok / Reels / YouTube Shorts · القنوات بدون وجه · حسابات الميمز

النمط: مراجع متعددة · المحرك: Gemini Omni · المخرج: 8–15 ث، 9:16، صوت أصلي

تدير قناة بدون وجه و"مقدّمك" شخصية بالذكاء الاصطناعي. فيديو الأسبوع الماضي استخدم الصورة المرجعية A؛ ويحتاج فيديو هذا الأسبوع إلى الشخصية نفسها بالملابس نفسها لكن بمشهد جديد وانفعال جديد. بدون مراجع تثبّت الهوية، يبدو كل فيديو وكأنه شخص مختلف. يحمّل Gemini Omni عدة مراجع (الشخصية، الملابس، الموقع، الإكسسوار، طبقة الصوت) ويحافظ عليها عبر المقطع — حتى تشعر سلسلتك فعلًا كسلسلة.

الوصف

[Reference: character.jpg] in a Tokyo arcade at night, neon reflections on her jacket, looking up at the camera, ambient city sound, 10 seconds, vertical.

التصوّر المسبق ولوحات القصة ونماذج الحركة

لصنّاع الأفلام المستقلين · مصمّمي الحركة · فنّاني التصوّر المسبق للمؤثرات البصرية · مديري التصوير · المطوّرين المتقدّمين الذين يبنون أدوات فيديو

النمط: نص إلى فيديو + مراجع متعددة · المحرك: Gemini Omni · المخرج: 8–15 ث، 16:9، صوت أصلي

أنت تعرض مشهدًا وتحتاج أن تُري المخرج إحساس حركة الدوللي قبل حجز يوم التصوير. كانت لوحات القصة تفعل ذلك بإطارات ثابتة؛ Gemini Omni يفعله بإطارات متحرّكة مع صوت. ثبّت حركة الكاميرا في الوصف، ثبّت الشخصية/الموقع بالمراجع، واخرج بشريط تصوّر مسبق قابل للمشاهدة بتكلفة أقل من اجتماع قهوة. المطوّرون المستقلون الذين يبنون أدوات فيديو يستخدمون الدورة نفسها لتجريب سلوك الحركة قبل الالتزام بدمج API.

الوصف

Wide shot of a lone figure on a coastal cliff at dusk, slow camera push-in, distant wave sound, golden hour lighting, 16:9 cinematic, 10 seconds.

الفيديوهات التوضيحية وتصوير المفاهيم

للمعلّمين · صانعي الدورات · قنوات YouTube التعليمية الترفيهية · كتّاب المحتوى التقني

النمط: نص إلى فيديو · المحرك: Gemini Omni · المخرج: 10–15 ث، 16:9، صوت أصلي

أنت تشرح مفهومًا يصعب رسمه — بروتين يطوي نفسه، ميكانيكا مدار، مشهد تاريخي، تفاعل كيميائي. اعتمد عرض Google لـOmni على هذه الحالة بالذات (طيّ بروتين بأسلوب الصلصال) لأن هنا يستحق الفيديو متعدد الوسائط مكانه: تستطيع وصف فكرة مجرّدة بلغة بسيطة، وتثبيتها بصريًا برسم مرجعي، وتسترجع مقطعًا قصيرًا سيشاهده الطالب فعلًا. السرد بلقطات متعددة يجعل الشرح يبني تدريجيًا بدلًا من البقاء على إطار واحد.

الوصف

Sequence: a single water droplet falling, splash in slow motion, droplet rejoining a stream, narrated voiceover explaining surface tension, 15 seconds, 16:9.

كيفية استخدام Gemini Omni

اختر نمط البداية

افتح أداة التوليد أعلاه. إذا كان لديك فكرة نصية فقط، ابقَ في تبويب نص إلى فيديو. إذا كان لديك صورة منتج أو ورقة شخصية أو إطار مرجعي، انتقل إلى صورة إلى فيديو. إذا أردت أقصى تثبيت هوية ممكن (نفس الشخصية، ونفس الملابس، ونفس الموقع عبر عمليات التوليد)، استخدم مراجع متعددة وحمّل أصول مرجعية متعدّدة — صور، مقاطع قصيرة، وطبقات صوت.

اكتب الوصف كأنك تعرض على مخرج

النمط: الموضوع + الإعداد + الإضاءة + حركة الكاميرا + الصوت + التنسيق + المدة. ستة عناصر. أي عنصر تتركه فارغًا، يملؤه النموذج بما هو متوسط إحصائيًا. مثال: "امرأة في الثلاثين بمعطف بيج تمشي عبر تقاطع شيبويا الممطر ليلًا، انعكاسات نيون على الرصيف المبلل، لقطة تتبّع بطيئة من الخلف، صوت مدينة محيط وحركة مرور بعيدة، عمودي 9:16، 8 ثوانٍ."

أنشئ، حسّن، وصدّر

حدّد المدة ونسبة العرض إلى الارتفاع، ثم اضغط إنشاء. يستغرق التوليد عادةً بضع دقائق حسب الإعدادات. عند انتهائه، يمكنك إصداره كما هو أو معاملته كمسودة أولى من محادثة: عدّل الوصف، غيّر مرجعًا واحدًا، أعد التوليد. صدّر بصيغة MP4 مع الصوت.

الأسئلة الشائعة

ما الحد الأقصى لطول الفيديوهات؟

يولّد Gemini Omni Flash حاليًا مقاطع تصل إلى نحو 10 ثوانٍ داخل تطبيق Gemini وعلى Nano Banana. أعلنت Google أن هذا اختيار نشر وليس حدًا صلبًا للنموذج، وأن مدد أطول قيد التطوير. سنرفع السقف على Nano Banana بمجرد أن ترفعه Google.

هل يولّد صوتًا أم أن الفيديو صامت؟

الصوت الأصلي مفعّل افتراضيًا — يُنتج Gemini Omni تعليقًا صوتيًا متزامنًا وصوتًا محيطًا وموسيقى كجزء من نفس عملية التوليد. أوقف الصوت من الأداة إذا أردت مقطعًا صامتًا للتحرير في برنامج مونتاج.

هل يمكنني استخدام المخرج تجاريًا؟

المخرجات من سير عمل Nano Banana قابلة للتصدير للاستخدام التجاري في الخطط المدفوعة. النقاط المجانية مخصّصة للتقييم. الشروط التفصيلية موجودة في شروط الخدمة — اقرأها قبل نشر المخرجات في حملة مدفوعة.

ما أنواع المراجع التي يمكنني إضافتها؟

يقبل نمط مراجع متعددة الصور الثابتة (الشخصية، الملابس، الموقع، المنتج، إطار الأسلوب)، ومقاطع فيديو مرجعية قصيرة (اتجاه الحركة، التأطير)، ومقاطع صوتية (نبرة الصوت، طبقة الموسيقى). كلما أضفت مراسي أكثر، صار التوليد أكثر قابلية للتنبّؤ — وهذا مهم عند إنتاج متغيّرات للشخصية نفسها عبر سلسلة.

كيف أحصل على تحرير محادثاتي أقرب إلى أسلوب Omni؟

أبقِ نفس الأصول المرجعية محمّلة، وعدّل عنصرًا واحدًا فقط من الوصف في كل مرة (غيّر الإضاءة فقط، أو حركة الكاميرا فقط، أو الملابس فقط)، ثم أعد التوليد. قاوم رغبة إعادة كتابة الوصف بالكامل — فهذا يُعيد ضبط الاتساق الذي بنيته. هذه نفس انضباطية التكرار التي تعمل داخل واجهة محادثة تطبيق Gemini.

كيف أكتب وصفًا يعطيني حركة واقعية؟

ثلاث قواعد. أولًا، سمِّ حركة الكاميرا صراحةً — "لقطة تتبّع بطيئة من الخلف"، "إطار ثابت مقفل"، "دفع دوللي على مدى أربع ثوانٍ". لغة الحركة الغامضة تنتج حركة غامضة. ثانيًا، أعطِ المحرك مرسى ماديًا في المشهد (سطح حقيقي، مصدر إضاءة حقيقي، وزن جسم حقيقي). ثالثًا، اجعل المقياس الزمني متطابقًا مع طول المقطع — حشر حركة بقيمة 30 ثانية في 8 ثوانٍ ينتج اهتزازًا.

هل أحتاج إلى اشتراك في Google AI لاستخدام Gemini Omni هنا؟

لا. يوفّر Nano Banana الوصول إلى Gemini Omni عبر نظام النقاط الخاص بنا — دون اشتراك Google AI Plus أو Pro أو Ultra. يحصل المستخدمون الجدد على نقاط مجانية عند التسجيل.

ما الفرق بين Gemini Omni وVeo؟

Veo هو نموذج الفيديو المخصّص من Google DeepMind — قوي في المظهر السينمائي والإضاءة وحركات الكاميرا. أما Gemini Omni فنموذج متعدد الوسائط يكون فيه إخراج الفيديو إحدى وسائط عدة يتعامل معها النموذج نفسه، مع تحرير محادثاتي مدمج. داخل تطبيق Gemini، حلّ Omni محل Veo. كلاهما متاح على Nano Banana — راجع مولّد Veo إن أردت مخرجًا سينمائيًا خالصًا دون الطبقة متعددة الوسائط.

هل يولّد Gemini Omni محتوى تزييف عميق أو شخصيات أفاتار؟

يتضمّن Gemini Omni ميزة أفاتار اختيارية بضمانات مضادة للتزييف العميق — يسجّل المستخدمون أنفسهم وهم يقرؤون تسلسلًا من الأرقام قبل أن يُسمح لهم بتوليد أنفسهم كأفاتار. تحرير الصوت المنطوق لفيديو موجود مقيّد على مستوى النموذج كإجراء وقائي. تنطبق الضمانات نفسها عند استخدام Gemini Omni على Nano Banana.