Sora هو نموذج توليد فيديو عام من OpenAI يقبل نصاً أو صورة أو فيديو كمدخل، ويُنتِج فيديو قصيراً بجودة عالية مع المحافظة على اتساق المشاهد والشخصيات. يتوفر عبر واجهة sora.com وداخل ChatGPT بقدرات تختلف حسب الخطة. النموذج مبني على Diffusion Transformer ويمثل الصور/الفيديو على شكل رقعات (patches) شبيهة بالـ tokens، ما يسمح بالتوسّع في المدد والدقات ونِسَب الأبعاد وبتناسق طويل المدى داخل اللقطة.
جدول «الأهم» في Sora (قدرات أساسية وحدود الاستخدام الحالية)
البند | ما الذي يقدمه Sora؟ |
---|---|
أنواع الإدخال | نص فقط، أو نص + صورة (تحريك صورة ثابتة)، أو نص + فيديو (تمديد/ملء لقطات). |
المدد/الدقة المتاحة | في واجهة Sora الحالية: حتى 20 ثانية وبحد أقصى 1080p، مع دعم عَرْضي/طولي/مربّع. + داخل ChatGPT: الحدود تختلف حسب الخطة. |
حدود الخطط (مختصر) | Plus: حتى 5 ثوانٍ عند 720p أو 10 ثوانٍ عند 480p. Pro: حتى 20 ثانية و1080p، تنزيل دون علامة مائية، وأولوية أعلى في الطوابير. (قد تُطبّق حدود/طوابير حسب الضغط). |
التحرير/الإخراج | توليد جديد، تمديد المقطع، مزج/Remix وBlend للأصول التي تأتي بها، ونِسَب أبعاد متعددة. |
النشر والخصوصية | افتراضياً قد تُنشر بعض المقاطع في Explore feed (يمكن التحكم بذلك). المقاطع المنشورة قابلة لإعادة المزج/التحميل من الآخرين وفق السياسات. |
التوفر | متاح في الدول المدعومة لدى OpenAI (يشمل EU/UK). تحقق من صفحة الدول المحدثة. |
السلامة والوسوم | مُصنِّف كشف فيديو مُوَلَّد، وخطط لإضافة C2PA لوسوم المنشأ عند نشره ضمن منتجات OpenAI. فلاتر نص/صورة قبل الإظهار. |
ملاحظة: بحث OpenAI أظهر أن النموذج قادر نظرياً على فيديوهات حتى دقيقة كاملة في بيئة بحثية، لكن حدود المنتج العام الحالية أقصر كما في الجدول.
كيف يعمل Sora تقنياً (تحت الغطاء)
- Diffusion Transformer (DiT): يبدأ من «ضوضاء» ثم يُزيلها تدريجياً عبر خطوات توليد، مع معماريّة Transformer تمنح قابلية توسّع أعلى. تمثَّل الإطارات على شكل رقعات (patches) تُعامل كـtokens، ما يتيح تدريباً موحّداً عبر مدد/دقات/نِسَب أبعاد مختلفة. هذا يُحافظ على اتساق العناصر حتى عند خروج الهدف من المشهد ثم عودته.
- Recaptioning من DALL·E 3: تُولِّد المنظومة أوصافاً غنيّة للبيانات البصرية أثناء التدريب، فتتحسن مطابقة التعليمات (prompt adherence) في الفيديو الناتج.
- محاكٍ مصغّر للعالم: تُقدَّم Sora في أبحاث OpenAI كموديل مرئي «عام» قادر على محاكاة العالم بالحركة—فكرة «world simulator» التي تسمح بتركيب لقطات متعددة وتماسك أنماطي وزمني.
واجهة الاستخدام وسير العمل
1) من داخل Sora Video Editor
- اكتب وصفك في الحقل أسفل الشاشة، أو ارفع صورة/فيديو كبذرة للمشهد.
- اختر نسبة البُعد (عرضي/طولي/مربع) ثم أنشئ الفيديو. يدعم المُحرّر توليد مقاطع حتى 20 ثانية، مع خصائص للتمديد والمزج.
2) من داخل ChatGPT (حسب الخطة)
- ستظهر قدرات توليد الفيديو مباشرة داخل الدردشة. الحدود الزمنية/الدقة تختلف: Plus أقل، Pro أعلى (تفصيل الجدول). الطوابير تُعطى فيها أولوية حسب الاشتراك.
3) إدارة النشر والخصوصية
- يمكنك التحكم في نشر المخرجات داخل Explore feed. إن نُشر المقطع، يمكن للآخرين Remix/Blend/Download ضمن القيود (لا يُسمح بصور/فيديوهات لأشخاص حقيقيين في بعض الحالات).
أفضل ممارسات «البرمجة الإخراجية» (Prompting) للفيديو
- السيناريو المصغّر (Shot List): قسم الفيديو إلى لقطات (افتتاح–تفاصيل–ختام).
- لغة سينمائية دقيقة: زوايا الكاميرا، عدسة (35mm/70mm)، حركة (Dolly/Orbit/Handheld)، الإضاءة (golden hour/soft light)، المزاج (documentary/ethereal).
- مفردات الحركة والزمن: سرعة، تتابع الأحداث، «قطع» داخلي (cutaway) إن رغبت بتنوع بصري.
- اتساق الشخصيات/الستايل: أعد استخدام أوصاف ثابتة للأزياء/الألوان/الخامات بين اللقطات لضمان الثبات.
- التحكم بالبذور والإصدارات: احتفظ بنسخ متعددة، وادفع بتغييرات تدريجية (تعديل زاوية فقط، ثم إضاءة، …) للوصول للأسلوب النهائي بكلفة أقل.
- تحويل صورة إلى فيديو: عندما تريد واقعية/اتساقاً أعلى لعنصر مركزي، ارفع صورة مرجعية ثم اطلب التحريك.
القيود العملية التي يجب توقعها
- المدة/الدقة: قيود زمنية/دقّية تختلف حسب الخطة؛ المقاطع الطويلة قد تتطلب تمديداً على مراحل.
- الطوابير والموارد: قد تحدث أوقات انتظار أثناء الذروة؛ تُعطى أولوية أعلى لاشتراكات Pro.
- سلامة المحتوى: يتم فحص النص وإطارات الفيديو تلقائياً؛ تُمنع طلبات تنتهك السياسات (عنف شديد، محتوى جنسي، كراهية، انتحال مشاهير/ملكية فكرية). هناك مُصنِّف كشف ومخطط لوسوم C2PA.
لماذا يُجبرنا «سياق الثورة» على الاستعانة بـ Sora وأمثاله؟
- يُقلل دورة إنتاج الفيديو من أسابيع إلى ساعات/دقائق: أفكار → نماذج أولية → معاينات قبل التصوير الفعلي.
- يُ democratize الإبداع: فرق صغيرة تنتج «نسخة أولى» بمعايير بصرية عالية لاختبار الرسائل قبل صرف الميزانية الكبيرة.
- التعليم/البحث: صنع محاكاة تجارب/سيناريوهات تعليمية مرئية بسرعة يعزز الفهم والابتكار.
- الامتثال المؤسسي: أدوات السلامة والوسوم والكشف المدمجة تُقرّب التقنية من متطلبات المؤسسات.
وصفة عمل جاهزة (Workflow عملي)
- حدّد النتيجة: 9:16 لإعلان قصير، أو 16:9 ليوتيوب/موقع.
- اكتب Prompt لقطة-بلقطة (3–5 لقطات تكفي لمقطع 10–20 ثانية).
- ولّد نسخة A/B بتغييرات صغيرة (عدسة، حركة كاميرا).
- اختر لقطة “المرساة” واحفظ الإعدادات؛ ثم مدِّد المشهد أو أعد المزج لعناصر ثانوية.
- تحقق من السياسات واضبط إعدادات النشر (إيقاف النشر العام إن لزم).
- صدّر وفق خطتك: Plus (480–720p قصير) للاختبار السريع، Pro (1080p حتى 20s) للنسخة النهائية الأولى.
أسئلة سريعة
- هل أستطيع توليد فيديو من صورة واحدة؟ نعم؛ يحرّك Sora الصورة بدقة عالية للتفاصيل.
- هل يدعم لقطات متعددة ضمن فيديو واحد؟ نعم مع اتساق للشخصيات والأسلوب عبر اللقطات.
- هل تُضاف علامة مائية؟ التنزيل دون علامة مائية متاح لمشتركي Pro.
- هل هو متاح في بلدي؟ راجع صفحة الدول المدعومة المحدثة.
التعاليق (0)