في جملة واحدة
Veo 3.1 يضيف صوتاً مدمجاً، تحسينات أدق، وواجهات برمجة تطبيقات ملائمة للمؤسسات دون تغيير في الأسعار. الأدوات لافتة، رغم أن بعض المستخدمين ما زالوا يفضّلون منافسين من حيث الواقعية والتحكّم في الأصوات.
التفاصيل
أطلقت جوجل Veo 3.1، وهو نموذج لتوليد الفيديو بالذكاء الاصطناعي (AI) يعزّز التحكّم الإبداعي والواقعية ويدمج الصوت بشكل أصيل. بات توليد الصوت متاحاً الآن عبر ميزات فلو (Flow) مثل "Frames to Video" و"Ingredients to Video" و"Extend/Scene Extension"، ما يتيح إغناء المقاطع بحوار وأجواء ومؤثرات صوتية متزامنة. كما تضيف فلو أدوات عملية لضبط الإضاءة والظلال. ويمكن للمطورين والمؤسسات الوصول إلى Veo 3.1 اليوم عبر واجهة برمجة تطبيقات Gemini (Gemini API)، على أن يتكامل قريباً مع Vertex AI.
يدعم Veo 3.1 إدخالات نصوص وصور وفيديو، وحتى ثلاث صور مرجعية (reference images)، مع استيفاء بين الإطارين الأول والأخير (first/last-frame interpolation)، وعمليات إدراج وإزالة الكائنات (Insert/Remove) — على أن تتوفر ميزة الإزالة في فلو قريباً. يبدأ بإنشاء مقاطع بطول 4–8 ثوانٍ ويمكن تمديدها إلى نحو 148 ثانية، مع إخراج بدقة 720p أو 1080p وبمعدل 24 إطاراً في الثانية (fps). يبقى التسعير دون تغيير ضمن المعاينة المدفوعة (paid preview) عبر واجهة برمجة تطبيقات Gemini (Gemini API): $0.40/ثانية (قياسي) أو $0.15/ثانية (سريع). تشمل ميزات الأمان علامات مائية من SynthID (SynthID watermarking) وإجراءات إشراف (moderation). وتشيد الآراء المبكرة بالأدوات وتحسينات الصوت، مع التنبيه إلى حدود مثل تنوّع الأصوات والمقارنات مع Sora 2 من OpenAI على صعيد الواقعية.
النقاط الرئيسية
- صوت مدمج عبر ميزات فلو (Flow) وتحسينات في ضبط الإضاءة والظلال تجعل الفيديوهات أكثر واقعية وأوسع قابلية للتحكّم.
- خيارات إدخال وتحكّم أغنى: نص/صور/فيديو، حتى ثلاث صور مرجعية (reference images)، استيفاء الإطارين الأول والأخير (first/last-frame interpolation)، إدراج/إزالة الكائنات (Insert/Remove)، وتمديد المشاهد (Scene Extension).
- مخرجات أطول: البدء بتوليدات 4–8 ثوانٍ وتمديدها حتى نحو 148 ثانية باستخدام "Extend/Scene Extension".
- فيديو حتى 1080p بمعدل 24 إطاراً في الثانية (fps)، مع علامات مائية من SynthID (SynthID watermarking) وإجراءات إشراف (moderation).
- متاح الآن في فلو (Flow) وواجهة برمجة تطبيقات Gemini (Gemini API) ضمن معاينة مدفوعة، على أن يتوفر دعم Vertex AI قريباً؛ التسعير ثابت عند $0.40/ثانية (قياسي) و$0.15/ثانية (سريع).