كيفية إنشاء صور احترافية باستخدام نموذج GPT-Image 1.5 من OpenAI، أعلنت شركة OpenAI عن إطلاق نموذج GPT-Image 1.5 الجديد لتوليد الصور وتحريرها، مقدّمةً نقلة نوعية في فهم الأوامر النصية الدقيقة، والقدرة على إنتاج صور عالية الجودة بسرعة ومرونة غير مسبوقتين، فقد شهدت تقنيات الذكاء الاصطناعي قفزات واسعة في مجال توليد الصور الرقمية، وأصبحت جزءًا مهمًا من أدوات الإبداع لدى الفنانين والمصممين وصناع المحتوى.
ما هو نموذج GPT-Image 1.5 الجديد؟
يأتي GPT-Image 1.5 كجيل متطور من أنظمة توليد الصور داخل منصة “شات جي بي تي” ChatGPT، حيث وفّر تحسينات هائلة في سرعة الإنتاج، ودقة فهم الأوامر، والحفاظ على الخصائص الفنية للصورة.
وبحسب OpenAI، فإن النموذج قادر على توليد الصور بسرعة تصل إلى أربعة أضعاف مقارنةً بالإصدار السابق، مع توفير تجربة أكثر مرونة لكل من المستخدمين والمطورين عبر واجهة برمجة التطبيقات (API).
ولا يقتصر النموذج على إنشاء الصور من الصفر، بل يمتد ليشمل القدرة على تحريرها، وإضافة عناصر جديدة إليها، وتحويل الأساليب الفنية، والدمج بين الصور بذكاء فائق.
تحرير أدقّ واتساق بصري أفضل
قدّمت OpenAI تطويرات جوهرية في مجال تحرير الصور داخل GPT-Image 1.5، إذ أصبح بإمكان النموذج تنفيذ تعديلات دقيقة في مناطق محددة من الصورة دون التأثير في بقية العناصر، كما يحافظ على اتساق الإضاءة وتوزيع العناصر والوجوه داخل المشهد، ويتعامل باحترافية مع الأساليب الفنية والدمج البصري، ومن أبرز حالات الاستخدام:
- تعديل الصور الاحترافية بدقة عالية.
- دمج الأشخاص والعناصر داخل صورة واحدة.
- إنشاء ملصقات سينمائية.
- تغيير تسريحة الشعر أو الملابس على نماذج بشرية افتراضية.
- تحويل الصور بين أساليب فنية متنوعة.
هذه القدرات تفتح المجال أمام صناعة محتوى بصري احترافي دون الحاجة إلى خبرة سابقة في التصميم أو استخدام برامج معقدة مثل الفوتوشوب أو غيرها من تطبيقات وبرامج.
قد يهمك: كيفية الربح من فيديوهات الذكاء الاصطناعي 2025
دقة أعلى في فهم الأوامر
ففي أحد الاختبارات التي استلزمت ترتيب 36 عنصرًا داخل شبكة منظمة، نجح الإصدار الجديد في تنفيذ التوزيع بدقة تامة، في حين فشل الإصدار السابق في ذلك.
كما تحسّن أداء النموذج في إدراج النصوص داخل الصور، بما في ذلك العناوين الصغيرة والبيانات والإنفوجرافيك القصير، ورغم ذلك، ما تزال هناك تحديات تتمثل في:
- النصوص الطويلة جدًا.
- الخطوط غير المشهورة.
- تعدد الوجوه المعقدة.
- الصور التي تشمل لغات متعددة في مشهد واحد.
مع ذلك، تؤكّد الاختبارات الداخلية أن GPT-Image 1.5 أظهر أداءً قويًا في سيناريوهات فوتوغرافية غير مألوفة، متفوقًا على الإصدار السابق ومنافسًا نماذج أخرى في السوق مثل “ناونو بنانا برو” Nano Banana Pro من جوجل.

قد يهمك: كيف تكشف مقاطع الفيديو المولّدة بالذكاء الاصطناعي؟
كيفية إنشاء صور احترافية باستخدام GPT-Image 1.5
يتيح النموذج الجديد لأي مستخدم إنشاء صورة احترافية داخل ChatGPT من خلال خطوات بسيطة:
- حدد فكرة الصورة بدقة، اكتب وصفًا تفصيليًا للمشهد الذي تريده (المكان – الإضاءة – زاوية التصوير – الشخصيات – الألوان).
- أضف النمط الفني المطلوب يمكنك طلب صور بأسلوب كلاسيكي، سينمائي، ثلاثي الأبعاد، كرتوني، فوتوغرافي، تجريدي… إلخ.
- أرسل الأمر للنموذج داخل شات جي بي تي ChatGPT، حيث يقوم النظام بتحليل النص وفهم الغرض ثم توليد الصورة تلقائيًا.
- حرّر الصورة إذا لزم الأمر يمكنك إزالة عنصر، أو إضافة شخص، أو تغيير الخلفية دون إعادة بناء المشهد بالكامل.
- حفظ واستخدام الصورة بعد التوليد، يمكن تحميل الصورة بجودة عالية واستخدامها في وسائل الإعلام، الإعلانات، أو التصميم.
أبرز مميزات نموذج GPT-Image 1.5
جاء الإصدار الجديد محمّلًا بميزات جوهرية تشمل:
- سرعة إنشاء صور أعلى بأربع مرات من الإصدار السابق.
- فهم عميق للأوامر النصية المعقدة وتحويلها إلى صور دقيقة.
- تحرير احترافي للصورة دون فقدان الجودة.
- قدرة على دمج عناصر وصور متعددة في مشهد واحد بسلاسة.
- تحسين عرض النصوص داخل الصور صغيرها وكبيرها.
- اتساق بصري أعلى في الإضاءة والوجوه والخلفيات.
- تحويل الأساليب الفنية ومرونة في التجارب البصرية.
- دعم لمجالات واسعة مثل الأزياء، التسويق، التعليم، والسينما.
هذه القوة تجعل GPT-Image 1.5 خيارًا مثاليًا للقطاعات الإبداعية والمؤسسات الإعلامية وصناع المحتوى الرقمي الإلكتروني.
مقارنة بين GPT-Image 1.5 ونموذج Google Nano Banana Pro

وإليك مقارنة بين نموذج شات جي بي تي للصور الجديد وبين نموذج جوجل نانو بانانا برو Google Nano Banana Pro، وكانت المقارنة على الشكل التالي:
| عنصر المقارنة | GPT-Image 1.5 من OpenAI | Google Nano Banana Pro |
|---|---|---|
| سرعة توليد الصور | أسرع بنحو 4 مرات من الإصدار السابق، وأداء إنتاجي أعلى بشكل ملحوظ | سرعة عالية لكنها تعتمد على نوع المشهد وتعقيده |
| فهم التعليمات النصية | دقة قوية جدًا في تنفيذ أوامر معقدة وترتيب عناصر متعددة داخل الصورة | جيدة ولكن أقل اتساقًا في التعامل مع الأوامر المعقدة جدًا |
| جودة التفاصيل البصرية | تفاصيل واضحة ومتناسقة في الإضاءة والوجوه والخلفيات | جودة عالية لكن أحيانًا تفقد الانسجام البصري عند كثرة العناصر |
| تحرير الصور | يدعم الإضافة والحذف والدمج مع الحفاظ على الاتساق العام | يدعم التحرير بمستوى جيد لكن بمرونة أقل |
| النصوص داخل الصور | تحسّن كبير في عرض نصوص صغيرة وكثيفة | جيد في النصوص الكبيرة والمتوسطة وليس بنفس الدقة للنصوص الصغيرة |
| الأساليب الفنية | تنوع واسع في تحويل الأساليب والأنماط الفنية | إمكانات محدودة مقارنةً بمرونة GPT-Image |
| التجارب الواقعية | أداء قوي جدًا في مشاهد فوتوغرافية غير مألوفة | أداء ممتاز لكنه يُظهر تفاوتًا في الظروف المعقدة للغاية |
في الختام، يؤكد نموذج GPT-Image 1.5 الجديد من OpenAI أن مستقبل توليد الصور أصبح أكثر نضجا واحترافية من أي وقت مضى، بفضل القدرة على فهم الأوامر بدقة، والتحكم الكامل في العناصر البصرية داخل الصورة، وسرعة الإنتاج العالية، فقد فتح النموذج الباب أمام عصر جديد من الإبداع الرقمي، حيث يستطيع الجميع المبتدئين والمحترفين (من المستخدم العادي إلى المصمم المحترف)، إنشاء صور مذهلة بسهولة وبتكلفة منخفضة وبأسلوب فني ينافس الأعمال الاحترافية.
***********************************************
