أطلقت جوجل جهاز Nano Banana 2، وهو نموذج التصوير الجديد المدعوم بالذكاء الاصطناعي

  • Nano Banana 2 هو نموذج جوجل الجديد لإنشاء الصور وتحريرها والمبني على Gemini 3.1 Flash Image.
  • يجمع هذا الجهاز بين سرعة الاستجابة العالية ودقة العرض المرئي العالية، ودقة تصل إلى 4K، وتحسين تتبع التعليمات المعقدة.
  • يتكامل مع تطبيق Gemini، والبحث، وLens، وAI Studio، وGoogle Cloud، وFlow، وGoogle Ads، مع توسيع نطاق طرحه ليشمل المزيد من البلدان واللغات.
  • يتضمن ميزات متقدمة مثل النص القابل للقراءة والترجمة في الصورة، واتساق الأحرف والأشياء، والختم باستخدام بيانات اعتماد SynthID وC2PA.

نموذج جوجل نانو بانانا 2 للذكاء الاصطناعي للصور

اتخذت جوجل خطوة جديدة في استراتيجيتها للذكاء الاصطناعي من خلال تقديمها لـ نانو بانانا 2، كما تم التعرف عليه أيضًا باسم صورة فلاشية لـ Gemini 3.1هو نموذج لتوليد الصور وتحريرها يهدف إلى تقليل الفجوة بين سرعة الاستجابة وجودة الصورة. وتسعى الشركة إلى تمكين منشئي المحتوى من العمل مع الصور في الوقت الفعلي تقريبًا دون التضحية بالنتائج التفصيلية والقابلة للاستخدام في السياقات المهنية.

يأتي هذا الإطلاق بعد إطلاق أول جهاز نانو بنانا و نانو بانانا بروعززت هذه الإصدارات بالفعل مكانة جوجل في مجال توليد الصور المرئية المدعومة بالذكاء الاصطناعي. ومع هذا الإصدار الجديد، تراهن الشركة على نموذج يُضيف ميزات كانت تُعتبر سابقًا "متطورة" إلى سير عمل أكثر مرونة، مصمم لـ المستخدمون الذين يقومون بإنشاء الصور بشكل متكرر، بدءًا من فرق التسويق وصولًا إلى المبدعين المستقلين والشركات العاملة في أوروبا والأسواق الأخرى.

ما هو نانو بانانا 2 وما هو الدور الذي يلعبه ضمن نظام جيميني البيئي؟

تصف جوجل جهاز Nano Banana 2 بأنه نموذج التصوير الأكثر تطوراً لديها حتى الآن ضمن بيئة الجوزاءتتميز هذه الأداة بكونها مبنية على بنية فلاش، التي تركز على سرعة الاستجابة الفائقة. والهدف منها ليس فقط إنتاج تصميمات جذابة، بل أيضاً الاندماج بسلاسة في سير العمل حيث كل ثانية مهمة.

وتؤكد الشركة عملياً أن يرث نانو بانانا 2 المعرفة العالمية، والمنطق، والدقة البصرية من نانو بانانا برولكنها تجمع بين هذه الميزات وسرعة نماذج فلاش. وهذا يتيح لك إنشاء الصور أو تعديلها في غضون ثوانٍ، وهو أمر بالغ الأهمية لمن يعملون مع عمليات تكرار مستمرة، أو اختبارات A/B، أو مراجعات سريعة مع عملاء وفرق موزعة في بلدان مختلفة.

النموذج الجديد موجه نحو كل من الخلق من الصفر كما تحرير المواد الموجودةتؤكد جوجل على أنه يمكن تطبيق التغييرات أو التعديلات أو الاختلافات دون أن يتطلب كل تعديل انتظارًا طويلاً، وهو ما يتناسب مع المهام الشائعة في الوكالات أو أقسام الاتصالات أو الشركات الصغيرة التي تدير محتواها المرئي الخاص.

علاوة على ذلك، تضع الشركة Nano Banana 2 كعنصر أساسي في استراتيجيتها للذكاء الاصطناعي التوليدي: حيث يتم دمجها في المنتجات الاستهلاكية وأدوات المطورين، بهدف جعل النموذج نفسه بمثابة الأساس للتجارب على الهاتف المحمول، وفي المتصفح، وفي بيئات الحوسبة السحابية الموجهة للأعمال.

المعرفة العالمية والدعم في البحث على الويب

إحدى ركائز نانو بانانا 2 هي الطريقة التي تستفيد بها من قاعدة معارف جيمينيبحسب جوجل، يمكن للنموذج الاعتماد على معلومات وصور من العالم الحقيقي من البحث على الويب في الوقت الحقيقي لتمثيل المفاهيم أو الأشياء أو المشاهد المحددة بدقة أكبر.

يتيح هذا الاتصال بالويب إمكانية إنشاء صور أكثر توافقًا مع السياقات الحالية، وهو أمر مفيد لـ الرسوم البيانية، والمحتوى المعلوماتي، أو تمثيلات البيانات المرئية والتي يجب أن تعكس مواقف محددة. بالنسبة لوسائل الإعلام، والمدونات المتخصصة، أو أقسام الاتصالات المؤسسية في أوروبا، يمكن لهذه الميزة أن تسهل عرض القصص الإخبارية والتقارير والعروض التقديمية دون الحاجة إلى البدء من الصفر في كل مرة.

تشير جوجل إلى أن هذا الفهم الأعمق يساعد أيضًا في تحويل الملاحظات إلى رسوم بيانية ومخططات وجداول توضيحيةوبعبارة أخرى، لا يستمد النموذج معلوماته من وصف عام فحسب، بل يحاول أيضًا تنظيم المعلومات بطريقة واضحة بصريًا، وهو أمر مثير للاهتمام بشكل خاص في التعليم أو التدريب المؤسسي أو التوثيق الفني.

بهذا النهج، تهدف الشركة إلى تمييز جهاز نانو بانانا 2 عن النماذج الأخرى التي تركز فقط على التأثير الجمالي. الفكرة هي أن هذه الأداة يمكن استخدامها للإبداعات الفنية و... المواد البصرية التي تصاحب البيانات أو العمليات أو المفاهيم المعقدةمما يعزز جاذبيتها للمنظمات التي تعمل مع التقارير والتحليلات بشكل منتظم.

تحسين معالجة النصوص داخل الصور، والترجمة، والتوطين

لطالما كانت إحدى أكثر المشكلات التي نوقشت في مجال توليد الصور بالذكاء الاصطناعي هي معالجة النص مدمجة في الصورة نفسهاحيث يمكن أن تؤدي الأخطاء في الأحرف أو الكلمات إلى إفساد تصميمٍ سليم. وتزعم جوجل أن نانو بانانا 2 يعالج هذه المشكلة بتحسينٍ ملحوظ في الجودة.

بحسب المعلومات المقدمة، فإن هذا النموذج قادر على إنشاء نصوص مقروءة ومتماسكة ضمن نماذج التسويق، والملصقات، والبطاقات، أو اللافتات.يقلل هذا من عدد المحاولات الفاشلة بسبب الأخطاء الإملائية. وقد يكون هذا مفيدًا بشكل خاص للفرق الصغيرة التي لا تملك قسمًا متخصصًا في التصميم وتحتاج إلى نتائج عملية بسرعة.

إضافة إلى هذه القدرات، هناك إمكانية لـ ترجمة وتوطين النص مباشرة داخل الصورةبمعنى آخر، لا يقتصر دور النظام على اكتشاف النص الموجود في الصورة أو العمل الفني فحسب، بل يتيح أيضًا تكييفه مع لغات مختلفة دون الحاجة إلى إعادة بنائه من الصفر. بالنسبة للحملات الأوروبية في أسواق متعددة، توفر هذه الميزة الوقت وتبسط عملية التكييف الثقافي واللغوي.

في مجالات مثل التجارة الإلكترونية والسياحة والتدريب عبر الإنترنت، فإن هذا المزيج من نص قابل للقراءة، ترجمة وتوطين يهدف هذا النظام إلى تحقيق سير عمل أكثر مرونة. إذ يمكن إعادة استخدام العمل الإبداعي نفسه في عدة دول، مع تعديل النصوص والرسائل بمساعدة الذكاء الاصطناعي بدلاً من إعادة تصميمها بالكامل لكل لغة.

مع كل هذا، يضع برنامج Nano Banana 2 نفسه كأداة تحاول تقليل أحد الاحتكاكات الكلاسيكية للصور التوليدية: الحاجة إلى اللجوء إلى برامج تحرير خارجية لصقل أو تصحيح النص الذي يظهر في التركيب.

التناسق البصري، والالتزام بالتعليمات، وجودة المخرجات

يركز قسم رئيسي آخر من الإعلان على التحكم الإبداعي والاتساق البصريتزعم جوجل أن جهاز Nano Banana 2 قادر على الحفاظ على تشابه يصل إلى خمسة أحرف ضمن نفس سير العمل، مع مراعاة الدقة حتى أربعة عشر غرضًاحتى لا تتغير بشكل جذري من صورة إلى أخرى.

هذه السعة مخصصة لاستخدامات مثل لوحات القصة، والسرد مشهدًا تلو الآخر، والحملات الإعلانية، أو تطوير عوالم بصرية متماسكة.في هذه السياقات، يمكن أن يؤدي تغيير مظهر الشخصية أو المنتج من لوحة إلى أخرى إلى كسر التجربة، لذا فإن التركيز على الاستمرارية البصرية أمر ذو أهمية خاصة للعلامات التجارية والمشاريع الإبداعية.

وتشير الشركة أيضاً إلى تحسن في اتباع التعليمات المعقدةسيكون النموذج أكثر قدرة على فهم دلالات التوجيهات بدقة، بدءًا من إشارات الأسلوب وصولًا إلى القيود التفصيلية على التكوين والإضاءة والتأطير، وسيُطابق توقعات المستخدم بشكل أدق. وهذا من شأنه أن يقلل عدد المحاولات اللازمة للوصول إلى نتيجة مرضية.

من الناحية التقنية، يقدم نانو بانانا 2 التحكم في نسبة العرض إلى الارتفاع ومجموعة من الدقة تتراوح من 512 بكسل إلى 4Kوهذا يجعل من الممكن تكييف نفس التصميم الإبداعي مع التنسيقات الرأسية أو الأفقية أو البانورامية، مما يغطي كل شيء بدءًا من منشورات وسائل التواصل الاجتماعي السريعة وحتى خلفيات الشاشة أو المواد المصممة للشاشات عالية الدقة.

تصر جوجل على أن النموذج يمثل تحسن عام في دقة الصورةبفضل الإضاءة الأكثر ثراءً، والتركيبات الأكثر وضوحًا، والتفاصيل الأكثر دقة، يهدف وضع الفلاش إلى أن يُنظر إليه ليس كخيار "مُخفِّض"، بل كبديل سريع يُمكنه أيضًا تقديم نتائج عالية الجودة. في قطاعات مثل التجارة الإلكترونية أو الاتصالات المؤسسية، يُمكن لهذا المزيج من السرعة والجودة أن يُحدث فرقًا حقيقيًا في العمل اليومي.

التوفر في منتجات جوجل والطرح الدولي

إن الإعلان عن Nano Banana 2 لا يقتصر على بيئة اختبار معزولة. جوجل تُفصّل عملية طرح واسعة النطاق عبر نظامها البيئي، والتي تبدأ بـ تطبيق الجوزاء ويمتد ذلك ليشمل العديد من خدماتها الرئيسية.

في تطبيق Gemini، Nano Banana 2 سيحل محل Nano Banana Pro في أوضاع Quick و Thinking و Pro.بحيث يصبح النموذج الجديد الخيار القياسي لمن يقومون بإنشاء الصور من المساعد. ومع ذلك، توضح الشركة أن مشتركي جوجل AI Pro وألترا سيستمرون في الوصول إلى برنامج Nano Banana Pro للمهام المتخصصة، والوصول إليه من خيارات إعادة توليد الصور عند الحاجة.

ويصل النموذج أيضًا إلى بحث جوجل من خلال وضع الذكاء الاصطناعي والعدسةسواء في التطبيق الرسمي أو على متصفحات الهواتف المحمولة وأجهزة الكمبيوتر. وتؤكد جوجل أن التوافر يتوسع ليشمل 141 دولة وإقليم جديد يا ثماني لغات إضافيةوهذا يعزز إمكاناتها كأداة للاستخدام الجماهيري خارج نطاق أسواق محددة.

في قطاع التطوير والحوسبة السحابية، يتم تقديم Nano Banana 2 في برنامج AI Studio ومن خلال واجهة برمجة تطبيقات Gemini في مرحلة المعاينة، تتيح هذه الميزة للشركات والمطورين دمج خاصية توليد الصور في تطبيقاتهم الخاصة. كما أنها مدمجة في جوجل كلاود باستخدام تقنية الذكاء الاصطناعي من فيرتكس في مرحلة تمهيدية، يفتح الباب أمام المشاريع التي تحتاج إلى توسيع نطاق إنشاء المحتوى المرئي من البنى التحتية المستضافة في سحابة الشركة.

علاوة على ذلك، تشير جوجل إلى أن نانو بانانا 2 سيصبح نموذج توليد الصور الافتراضي في Flowتتوفر أداة Flow، المصممة خصيصًا لسير العمل الإبداعي، وفي بعض الحالات، للإنتاج السمعي البصري، لجميع مستخدمي Flow دون أي تكلفة إضافية من حيث الرصيد. وفي مجال الإعلان، يتم دمج هذا النموذج في إعلانات Google لتعزيز الاقتراحات المقدمة للمصممين المبدعين عند إعداد الحملات، وهو أمر يمكن أن يكون له تأثير مباشر على عمل الوكالات والمعلنين في إسبانيا وبقية أوروبا.

الشفافية، ومصدر المحتوى المُنشأ، وأمانه

إلى جانب الميزات الإبداعية، تخصص جوجل جزءًا من الإعلان لـ أصل المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي والتحقق منه، وهي قضية حساسة بشكل متزايد بالنسبة للهيئات التنظيمية والمستخدمين ووسائل الإعلام الأوروبية.

توضح الشركة أنها تجمع بين تكنولوجيا العلامة المائية SynthID باستخدام بيانات اعتماد المحتوى المستندة إلى المعيار C2PAوبالتالي، فإن الصور التي تم إنشاؤها باستخدام Nano Banana 2 تتضمن إشارات غير مرئية وبيانات وصفية موحدة تسمح لنا بمعرفة ما إذا تم استخدام الذكاء الاصطناعي في إنشائها، وفي بعض الحالات، تفاصيل حول النموذج المستخدم وسياق الإنشاء.

تشير جوجل إلى أنه تم استخدام ميزة التحقق من SynthID في تطبيق Gemini أكثر من 20 مليون مرة منذ نوفمبريُعطي هذا فكرة عن الاهتمام بتحديد مصدر المحتوى المرئي. كما أعلنت الشركة عن نيتها دمج التحقق من C2PA في التطبيق، مما يعزز إمكانية التتبع بما يتماشى مع المناقشات التنظيمية الجارية في أوروبا بشأن المحتوى الاصطناعي.

يتماشى هذا التركيز على الشفافية مع حاجة الشركات والإدارات العامة ووسائل الإعلام إلى تحديد مصدر الصور بشكل أوضح، لا سيما تلك التي تُنتجها نماذج الذكاء الاصطناعي. في ظل انتشار المحتوى المرئي بسرعة عبر وسائل التواصل الاجتماعي والمنصات الرقمية، بات وجود آليات للتصنيف والتحقق أمراً بالغ الأهمية لبناء الثقة.

بشكل عام، استراتيجية جوجل مع نانو بانانا 2 يجمع هذا النظام بين عدة طبقات: من ناحية، السرعة والجودة والتحكم الإبداعي؛ ومن ناحية أخرى، التكامل في المنتجات اليومية والأدوات المهنية؛ بالإضافة إلى تدابير تحديد المنشأ المصممة لسيناريو يكون فيه للمحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي حضور متزايد الوضوح في الحياة اليومية والنشاط الاقتصادي في إسبانيا وأوروبا والأسواق الأخرى.

صورة GPT 1.5
المادة ذات الصلة:
صورة GPT 1.5: كيف يُغير الذكاء الاصطناعي عملية توليد الصور وتحريرها

تابعونا على أخبار جوجل