طور Google Researchمحول رؤية جديدًا من نص إلى صورة، حيث يتيح StyleDrop من Google للمستخدمين وصف الكائنات وتحديد الأنماط الفنية التي يرغبون في دمجها، ويخرج StyleDrop الصور التي تعكس مواصفات المستخدم في حوالي ثلاث دقائق.
يرى المطورون هذا البرنامج، الذي لم يتم إصداره للجمهور بعد، كمساعدة كبيرة لمديري الفن ومصممي الرسومات الذين يمكنهم إنشاء صور واقعية للمنتجات أو السمات المعينة التي تتضمن نصًا يعكس نفس الألوان والهيكل والأسلوب.
كيف يمكن استخدام الإصدار المقبل؟
وفقا لما ذكره موقع "techxplore"، قالت Google في تقريرها "الأسلوب المقترح متعدد الاستخدامات للغاية ويلتقط الفروق الدقيقة وتفاصيل الأسلوب الذي يوفره المستخدم، مثل أنظمة الألوان والتظليل وأنماط التصميم والتأثيرات المحلية والعالمية".
ينشئ StyleDrop أيضًا أسلوب الطباعة الذي يدمج الميزات الأسلوبية للصور، على سبيل المثال، يمكن للمستخدمين اقتراح صورة جسر وحرف ثم تحديد نمط الرسم، مثل هذه الأنماط يمكن أن تكون "النحت الخشبي" أو "العرض ثلاثي الأبعاد" أو "الرسم الكرتوني" أو أي نمط مفضل آخر، خيال المرء هو المتحكم.
ستعمل StyleDrop بعد ذلك على إنشاء عروض رائعة للكائنات، أو ربما نسخة شبيهة بالرسوم المتحركة، جنبًا إلى جنب مع الحروف التي تتضمن نفس الخصائص.
تعمل StyleDrop بالاتصال مع Google Muse، وهو محول الرؤية التوليدي الذي تم الكشف عنه في وقت سابق من هذا العام والذي يوفر درجة جيدة من الواقعية، تم تدريب Muse على 3 مليارات معلم، مما يضمن القدرة على توليد صور عالية الجودة.
قام الباحثون بتقييم دقة وجودة مخرجات StyleDrop باستخدام نصوص CLIP المعيارية للصناعة وتسجيل النمط بالإضافة إلى تعليقات المستخدمين، ووجدت التقييمات أن StyleDrop "يتفوق بشكل مقنع" على أساليب إنشاء الصور والنصوص الرائدة الأخرى.