أوامر تصميم الصور بالذكاء الاصطناعي عن طريق DALL·E 3

You are currently viewing أوامر تصميم الصور بالذكاء الاصطناعي عن طريق DALL·E 3
  • Post last modified:4 فبراير، 2024

سنتحدث في هذا المقال عن أوامر تصميم الصور بالذكاء الاصطناعي عن طريق DALL·E 3 بسبب البحث المتكرر عنه حيث أن تصميم الصور بالذكاء الاصطناعي له أهمية كبيرة, تابع هذا المقال لتعرف أكثر عنه.

في الماضي، حصر مفهوم الإبداع بالقدرات البشرية، حيث اعتبرت الروبوتات مجرد أدوات وظيفية بحتة. لكن في عالمنا المعاصر، شهدنا تحولًا مذهلًا في قدرات الروبوتات، حيث باتت تتمتع بإمكانات إبداعية فائقة، من كتابة الشعر وسرد القصص إلى رسم اللوحات الفنية المستوحاة من أساليب فنية شهيرة.

لعل أبرز مثال على هذه التطورات هو “دال إي 3” (DALL·E 3)، وهو نموذج ذكاء اصطناعي قادر على ترجمة الأوامر النصية إلى صور واقعية للغاية. وبفضل هذا التقدم، أصبح بإمكان الروبوتات المشاركة في مجالات الإبداع التي كانت حصرية للبشر، مما يفتح آفاقًا جديدة للابتكار والتواصل البشري.

إن هذا التطور ليس مجرد خطوة تكنولوجية فحسب، بل ثورة في مفهوم الإبداع ذاته. فمع ازدياد تداخل الذكاء الاصطناعي في هذه المجالات، تتغير طبيعة الإبداع البشري، حيث يتحول من مفهوم فردي إلى تعاوني بين البشر والروبوتات.

لكن هذا لا ينفي أهمية الإبداع البشري، فما زال للإنسان القدرة على التعبير عن عواطفه وأفكاره وتجاربه بطريقة فريدة لا يمكن للآلات تقليدها. ومع ذلك، فإن الروبوتات يمكن أن تكون مساعدين قيّمين في عملية الإبداع، حيث يمكنها توفير الأدوات والتقنيات التي تسمح بالتعبير الإبداعي بشكل أكثر شمولاً وإبداعًا.

في هذا العالم المتغير باستمرار، يتعين علينا أن نتقبل هذا التحول في مفهوم الإبداع ونتعلم كيفية التفاعل مع الروبوتات بشكل تعاوني. ففي النهاية، فإن الهدف هو تعظيم إمكانات الإبداع البشرية والروبوتية، مما يؤدي إلى إنتاج إبداعات أكثر إثراءً للحياة البشرية.

 

يشهد عالم الذكاء الاصطناعي تطورًا مذهلاً، حيث يطرح باستمرار تقنيات جديدة ومبتكرة تفتح آفاقًا غير محدودة أمام الإبداع والابتكار. وفي هذا الصدد، يبرز اسم شركة OpenAI كأحد الرواد في هذا المجال، حيث اشتهرت بتطوير نماذج ذكاء اصطناعي فائقة التطور مثل DALL·E وChatGPT.

ومؤخرًا، أضافت OpenAI إنجازًا جديدًا إلى قائمة إنجازاتها بإطلاقها لنموذج DALL·E 3، وهو أحدث نسخة من هذا النموذج الرائع. ما يميز DALL·E 3 هو أنه يوفر تجربة تفاعلية فريدة، حيث يمكنك استخدامه مباشرةً من خلال ChatGPT.

إذا كنت مهتمًا باستكشاف هذا المزيج الاستثنائي بين ChatGPT و DALL·E 3، فإليك بعض النقاط الأساسية التي تساعدك على البدء:

  • تعرف على DALL·E 3: اقرأ عن قدرات وخواص DALL·E 3، وافهم كيفية إنشاء الطلبات الفعالة لإنشاء الصور التي تريدها.
  • جرب DALL·E 3 على ChatGPT: ابدأ بإنشاء مطالبات بسيطة وسهلة التنفيذ على ChatGPT. لاحظ كيف يترجم ChatGPT مطالباتك إلى صور واقعية.
  • طور مهاراتك في إنشاء الطلبات: مع الممارسة، ستتمكن من إنشاء مطالبات أكثر تعقيدًا ودقة، مما ينتج عنه صور أكثر إبداعية وواقعية.
  • اشترك في خدمة API أو Labs: عندما تتوفر إصدارات API وLabs الرسمية، يمكنك الاشتراك فيها لتجربة DALL·E 3 بشكل كامل والاستفادة من جميع ميزاته المتقدمة.

 

مقدمة DALL·E 3 

في شهر نوفمبر من عام 2023، نشر OpenAI فيديوًا تشويقيًا لنموذج اللغة الجديد DALL·E 3. أثار الفيديو إعجابًا كبيرًا على وسائل التواصل الاجتماعي، حيث أظهر قدرة DALL·E 3 على إنشاء صور واقعية ومبدعة بناءً على أوصاف نصية.

يمكن الوصول إلى DALL·E 3 حاليًا من خلال ChatGPT Plus أو ChatGPT Enterprise. عند بدء محادثة جديدة، يمكنك اختيار التبديل إلى وضع DALL·E 3 beta.

تمامًا مثل التطبيقات الأخرى القائمة على GPT-4 ، يمكنك إرسال ما يصل إلى 50 رسالة في فترة زمنية مدتها 3 ساعات. وهذا يعني أنه مع اشتراك ChatGPT Plus أو Enterprise ، يمكنك إنشاء مئات الصور على DALL·E 3 يوميًا. علاوة على ذلك ، إذا كنت قد استخدمت DALL·E 3 في Bing Chat ، فقد تلاحظ أن إصدار ChatGPT يوفر لك تحكمًا أكبر في فنك.

بعد أن استعرضنا النقاط الأساسية، ننتقل الآن إلى الحديث عن بعض الميزات الجديدة التي تم تقديمها في DALL·E 3.

ما الذي يمكن توقعه من DALL·E 3

لإبراز التحسينات في النتائج التي يقدمها DALL·E 3، عرض OpenAI المثال التالي: باستخدام نفس النموذج، تم إنشاء أول صورة على DALL·E 2 والثانية على DALL·E 3.

الأمر: “An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.”

الصورة (1) تم إنشاؤها في DALL·E 2

 

الصورة (2) تم انشاؤها في DALL·E 3

دعونا الآن نلقي نظرة فاحصة على بعض التحسينات الدقيقة التي تم تقديمها في DALL·E 3.

ملاحظة: استخدمنا ChatGPT لإنشاء أفكار المطالبات، ثم استخدمنا DALL·E 3 لإنشاء الصور.

يلتقط تفاصيل معقدة بدقة أفضل

تتمتع DALL·E 3 بقدرة استثنائية على التقاط التفاصيل الدقيقة في الصور التي تخلقها. يمكنها معالجة أوصاف نصية معقدة وإنشاء صور واقعية تتميز بدقة متناهية.

على عكس النماذج السابقة التي قد تواجه صعوبة في الحفاظ على جميع التفاصيل في الصور عند تقديم مطالب متعددة ، فإن DALL·E 3 قادرة على التعامل مع مجموعة متنوعة من العناصر والتفاصيل دون إغفال أي منها.

الأمر: “Design a photorealistic image of a serene Japanese garden with a red torii gate, a koi pond, meticulously raked gravel, and blossoming cherry trees.”

أظهرت DALL·E 3 قدرة فائقة على تمثيل التفاصيل الدقيقة في المطالبات، بما في ذلك الحصى وبركة الكوي والبوابة الحمراء التوريقي. فقد تمكنت من إنشاء صور واقعية ومفصلة بشكل مذهل، حتى في الحالات التي كانت فيها المطالبات صعبة أو معقدة.

يقوم DALL·E 3 بتعديل مطالباتك للحصول على تنوعات أفضل

أجرينا اختبارًا سريعًا لواجهة DALL·E 3 وسهولة إنشاء الصور من خلالها، وذلك باستخدام المطالبات البسيطة التالية.

الأمر: “Imagine a simple living room, but render it in a distinctive Picasso style.”

تم إنشاؤها في DALL·E 3

توفر لك معظم مولدات الفن الاصطناعي، بما في ذلك DALL·E 3، 4 تنسيقات فنية مختلفة بناءً على مطالبتك. يمكنك النقر على صورة لرؤية المطالبة الدقيقة التي عالجتها الأداة لإنشاء تلك الاختلافات المحددة.

تم إنشاؤها في DALL·E 3

يمكن ملاحظة أن مطالبات DALL·E 3 لكل صورة مبنية على المطالب الأصلية التي يتم تقديمها إليها، ولكنها أكثر تفصيلاً. يؤدي مقارنة هذه المطالب إلى فهم أفضل لكيفية تعديل مطالبات DALL·E 3 الخاصة بك لتحقيق نتائج أفضل في المستقبل.

بالنسبة للإبداعيين، فإن هذا يعني أنه لا يتعين عليهم القلق كثيرًا بشأن تعلم كيفية تصميم مطالبات فعالة. تتولى تكامل ChatGPT هذه المهمة، مما يوفر راحة كبيرة للمستخدمين. ويؤدي هذا أيضًا إلى تفسير بعض الاختلافات التي لوحظت بين أداء DALL·E 3 على Bing Chat و ChatGPT.

 

أصبح تحسين نتائجك أسهل بكثير بفضل ChatGPT

عند استخدام ChatGPT لإنشاء صور، يبدو أن إدخال تعديلات صغيرة أو طلب مراجعات إضافية لأي صورة تم إنشاؤها أمرًا أكثر سهولة. يمكن أن تكون الطرق التي يمكن بها تحقيق ذلك في DALL·E 3 بسيطة، مثل تحديد جوانب محددة تحتاج إلى تعديل. لنلقي نظرة على مثال على كيفية تحقيق ذلك.

الأمر: “A cozy illustrated library scene with wooden shelves full of books, comfortable armchairs, a steaming cup of tea on a small table, and a sleeping cat on one of the chairs. The style should be warm and inviting, reminiscent of a children’s book illustration.”

تم إنشاؤها في DALL·E 3

لتقييم سهولة تحسين النتائج، قمنا بطلب تنويعات من DALL·E 3 للصورة الأولى مع تغيير لون الكرسي فقط في كل تصميم. وفيما يلي النتائج:

تم إنشاؤها في DALL·E 3

كما يمكن ملاحظته، تم الاحتفاظ بالتفاصيل وتم فهم الطلب بشكل جيد. ومع ذلك، يظهر أن إدخال تلك التغييرات على عناصر معينة يبدو أكثر بساطة باستخدام رقم البذرة في Midjourney، أو حتى باستخدام Adobe Firefly لتحرير تفاصيل محددة داخل التصميم.

الرفع من مستوى الأخلاقيات والسلامة

تظل هناك منطقة غير واضحة عندما يتعلق الأمر بترخيص الفن المولد بواسطة الذكاء الاصطناعي. ومع ذلك، ولضمان الاستخدام الأخلاقي للذكاء الاصطناعي في إنتاج الصور، أعلنت OpenAI عن بعض الإعلانات فيما يتعلق بـ DALL·E 3. لقد قاموا بتقييد قدرة DALL·E 3 على إنشاء “محتوى عنيف أو للبالغين أو كراهيية”.

تشمل بعض التدابير الإضافية التي تم اتخاذها لضمان الاستخدام الأخلاقي للذكاء الاصطناعي:

  1. رفض الطلبات التي تشمل أي صور تتضمن أي شخصيات عامة بالاسم (وذلك للتصدي لاستخدام deepfakes في نشر معلومات كاذبة).
  2. الاستجابة بتوازن أكبر للتقليل من التحيز فيما يتعلق بتمثيل فئات سكانية معينة بشكل زائد أو ناقص.
  3. رفض الطلبات التي تطلب من الأداة تقليد أسلوب فنان حي.
  4. توفير خيار للفنان للاستبعاد للسماح للمبدعين بسحب أعمالهم من استخدامها لتدريب نموذج إنتاج الصور في المستقبل.

 

DALL·E 3 لا يزال بعيدًا عن الكمال

رغم أننا لا نستطيع إنكار حقيقة أن DALL·E 3 يشكل خطوة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التوليدي، إلا أنه ما زال يحمل مجموعة من القيود الخاصة به. وهذا يعني أنه حتى إذا كانت لديك أفضل استفسارات لـ DALL·E 3، فإن هناك بعض الجوانب التي قد تواجهها الأداة بتحدي. فما هي تلك الجوانب؟ لنلقي نظرة على بعضها.

ليست الأداة الأكثر وعياً مكانيًا حتى الآن

تظهر استفسارات DALL·E 3 الوصفية نتائج جيدة، وهذا شيء نعلمه الآن. ومع ذلك، بغض النظر عن مدى تفصيل استفساراتك لـ DALL·E 3، قد تفتقد النتائج إلى بعض التفاصيل عندما يتعلق الأمر بتحديد مكان الكائنات داخل الإطار. ببساطة، الوعي المكاني لـ DALL·E 3 لا يزال دون المستوى المطلوب.

الأمر: “Create a vivid and realistic image of a serene living room scene. In the foreground, imagine a content cat peacefully nestled beneath a wooden table. The table is placed against a wall with windows on both sides of the table and a blank photo frame hung right above the table. The living room should be tastefully decorated with comfortable furniture, soft colors, and an atmosphere of tranquility.”

وفيما يلي النتائج المُنشأة. الصور الأولى والثانية والرابعة التقطت تقريبًا كل تفصيل صغير تم الإشارة إليه في التوصيف، سواءً في الألوان أو الأجواء أو النمط البصري. ومع ذلك، يُلاحظ أن مواقع القط والطاولة في النتائج لا تتبع بدقة التوجيهات. وهذا يظهر نقصًا واضحًا في الوعي المكاني لدى DALL·E 3.

تم إنشاؤها في DALL·E 3

باختصار، إذا كنت تمتلك صور مرجعية بسيطة لخلق فنون باستخدام مولدات الذكاء الاصطناعي مثل DALL·E 3، فيمكن أن يساعد ذلك. ومع ذلك، لا يمكن أن يحل محل مهارات مصممي الجرافيك البشر!

 

التحديات عند التعامل مع النصوص في الصور

إذا كنت قد استخدمت مولدات الفن بواسطة الذكاء الاصطناعي في السابق، فمن المرجح أنك واجهت مشكلة ظهور نصوص عشوائية على الصور المُنشأة. مع كل تطوير، عملت أدوات تحويل النص إلى صور بواسطة الذكاء الاصطناعي على التعامل مع هذه القيود.

لقد دخلنا إلى حقبة تمكنك الآن من طلب من مولدات الصور تضمين نصوص معينة داخل الصورة، وينطبق ذلك أيضًا على DALL·E 3. ومع ذلك، هناك حالات يخطئ فيها DALL·E 3 في عملية تقديم النص.

لفهم هذا بشكل أفضل، دعونا نلقي نظرة على المثال أدناه. لاحظ الطباعة الخاطئة في الصورة الثانية (بالطبع، دون نسيان مجموعة الكفوف الإضافية!)

الأمر: “A cute cat sitting on a sidewalk, holding a placard that reads ‘For Hire.’ The cat should look friendly and approachable, with bright eyes and a fluffy tail. The setting is a sunny day in a bustling city street, with people walking by and tall buildings in the background.”

بالنظر إلى أن DALL·E 3 لا يزال في مراحله الأولى من التطوير، فقد يواجه بعض التحديات في بعض الأحيان. على سبيل المثال، قد يتطلب الأمر عدة محاولات للحصول على النص مُنْتَجًا بشكل صحيح في الصورة، وقد تظهر بعض العيوب الطفيفة في السمات الجسدية للموضوعات البشرية في الصورة.

ومع ذلك، فإن التطورات الأخيرة في DALL·E 3 تدل على مستقبل واعد لهذه التكنولوجيا. وقد أذهل المستخدمون بقدرتها على إنشاء صور واقعية وتفاعلية، مما يجعلها أداة قيمة للفنانين والمصممين والمبدعين الآخرين.

إذا كنت تفكر في استخدام DALL·E 3 في سير عملك الإبداعي، فتأكد من إجراء بعض الأبحاث حول الأداة وقراءة التعليقات من المستخدمين الآخرين. يمكن أن تكون هذه المراجعات مفيدة في تحديد قدرات الأداة وحدودها.

آراء مستخدمي DALL·E 3:

  1. زيادة في القدرات تعني زيادة في حالات الاستخدام
  2. تستعرض السلسلة أدناه العديد من السبل التي يمكنك من خلالها استفادة من DALL·E 3. من إلهام تصميم العلامات التجارية إلى أفكار تزيين الغرف وأفكار الرسم، تستعرض السلسلة التطبيقات بمعالم عملية لكل فكرة مع أمثلة على الاستخدام.

 

إنشاء رموز باستخدام DALL·E 3

مع فهم DALL·E 3 للاستعلامات بشكل أفضل، بات استخدامه لإنشاء تصاميم شخصية أكثر مثل الرموز هو تطبيق يقوم به عدة مستخدمين. يشير أحد المستخدمين إلى جودة النتائج.

تجربة استخدام DALL·E 3 لإنشاء رمز جديد لتطبيق Hotlist.

  • الإيجابيات: إنه رائع بشكل لا يصدق.
  • السلبيات: ليس جيدًا في التنقل باتجاه تصميم معين. pic.twitter.com/o19J0JPj51

— ريك شينينك (@rikschennink) 17 أكتوبر 2023

كما يظهر، فإن التركيز على اتجاه تصميم واحد وإنشاء المزيد من الرموز بأسلوب بصري متجانس قد لا يكون سهلاً على الإطلاق.

حاولنا إنشاء مجموعة رموز كاملة للتعامل مع هذا، وإليك ما لاحظناه.

الأمر: “Generate an icon set representing safety and hygiene features, like face masks, hand sanitizers, contactless delivery, and temperature checks, with a uniform look.”

بالإضافة إلى الالتزام بفقرات الألوان المحددة، تتضمن بعض الرموز عناصر عشوائية وتستبعد بعضها (كما في غياب العيون في رموز الكمامة في المجموعتين الأوليين). وبالطبع، تظهر قضية الأخطاء الإملائية في النص! (الحروف “i” المزدوجة في “deliver”). نظرًا للوضع الحالي، قد تحتاج إلى استيراد تصاميمك إلى أدوات مثل Adobe Illustrator وتحويلها إلى صيغة متجهة، لإجراء التحسينات وجعل الرموز جاهزة للاستخدام.

بعض الأساليب البصرية كانت أفضل على DALL·E 2

في المنشور أدناه، يعبر المصمم عن خيبة أمله من كيفية أداء DALL·E 3، حيث يظهر أنه يقل قليلاً عن DALL·E 2 عندما يتعلق الأمر بتأثيرات السينمائية على الصور.

Dalle2 vs Dalle3

ما هذا الكابوس والتراجع المروع للأعمال السينمائية؟! لا أستطيع حتى التعبير عن مدى سوء النتائج؟؟ جربت الاستفسارات التي استخدمتها في كتابي الإلكتروني و… واو، رهيب.

أعتقد أن هذا هو السبب فيما أرى من الكوميديا المحرجة…

آمل ألا يتم إيقاف Dalle2 أبدًا! pic.twitter.com/clHYKdtOZQ

— جولي و. تصميم (@juliewdesign_) 15 أكتوبر 2023

كما يظهر، على الرغم من التحسينات وسهولة الاستفسارات المُقدمة، هناك بعض التنازلات خاصةً عند التفضيل لأنماط بصرية معينة.

 

إضافة النصوص في الصور: قفزة هائلة

تقديم السلسلة أدناه العديد من الأمثلة التي تسلط الضوء على الفوائد الكبيرة التي يمكن تحقيقها باستخدام مولدات الصور بواسطة الذكاء الاصطناعي التي تتيح الخيار لإضافة نصوص داخل الصور. توضح الأمثلة أيضًا كفاءة DALL·E 3 في تحقيق هذا الهدف. ولكن نعم، كما نوقش سابقًا، يتطلب الأمر بعض التكرارات لضبط النصوص والحصول على نسخة بدون أخطاء في النص.

DALL•E 3 هو محول للألعاب بشكل كامل!

من بين ميزاته الرائعة هي القدرة على إنشاء نصوص داخل الصور.

كنت أستمتع بإنشاء هذه التخطيطات باستخدام استفسارات بسيطة.

ترقبوا الاستفسار والدليل قريبًا. pic.twitter.com/BEXVOsTy8p

— مين تشوي (@minchoi) 6 أكتوبر 2023

 

تجربة نسب الأبعاد

تتم إنشاء الصور بنسبة الأبعاد 1:1 افتراضيًا. ومع ذلك، يمكنك أيضًا تحديد النسبة المطلوبة في استعلامك. يوضح المنشور أدناه كيف يمكن لإضافة نسبة الأبعاد إلى الاستعلام إنشاء تصاميم بالأبعاد المقصودة.

لفهم هذا بشكل أفضل، جربنا استخدام نفس الاستعلام وتغيير نسبة الأبعاد المحددة فقط. اطلع على النتائج بنفسك.

الأمر: “Vintage illustration of a dragon and a unicorn playing chess in a medieval castle with an aspect ratio 2:1”

الأمر: “Vintage illustration of a dragon and a unicorn playing chess in a medieval castle with an aspect ratio 9:16”

هل ترغب في اكتشاف مزايا DALL·E 3 الرائعة

يُعد DALL·E 3 بلا شك أداة ثورية في مجال مولدات الفن الصنعي المدعومة بالذكاء الاصطناعي. ومع ذلك، لا يزال هناك مجال للتحسين في بعض الجوانب، مثل دقة التفاصيل وسهولة الاستخدام. على الرغم من ذلك، فإن DALL·E 3 يمثل خطوة كبيرة إلى الأمام مقارنة بسابقتها، DALL·E 2.

تعمل ميزة ChatGPT المدمجة في DALL·E 3 على تسهيل العملية الإبداعية بشكل كبير. يمكن لـ ChatGPT مساعدتك في صياغة المحفزات المناسبة لصورك المبتكرة، مما يقلل من الحاجة إلى التجربة والخطأ.

ومع ذلك، يجب أن تدرك أن DALL·E 3 لا يزال في مرحلة التطوير، لذلك قد تواجه بعض الأخطاء أو عدم الدقة. بالإضافة إلى ذلك، قد لا يكون DALL·E 3 مناسبًا لجميع المشاريع، خاصةً إذا كنت تتطلب تصميمات مخصصة للغاية.

إذا كنت تبحث عن بديل أكثر شمولاً، ففكر في الاشتراك في خدمة تصميم غير محدودة مثل KIMP. تتيح لك KIMP إنشاء تصميمات غير محدودة مع إمكانية الوصول إلى فريق تصميم مخصص يعمل على تحسين تصاميمك لتتناسب مع احتياجاتك المحددة.

 

اقرأ أيضًا:


المصدر: Kimp

 

 

 

اترك تعليقاً