گوگل در حال ارتقاء مدل تولید تصویر خود با قابلیتهای جدید ویرایشی، وضوحهای بالاتر، رندر متن دقیقتر و امکان جستجوی وب است.
مدل جدید که نانو بنانا پرو نام دارد، بر پایهٔ آخرین مدل زبان بزرگ گوگل، Gemini 3، که اوایل این هفته منتشر شد، ساخته شده است. این شرکت ادعا میکند نانو بنانا پرو نسبت به نسخهٔ پیشین خود، نانو بنانا، میتواند تصاویر دقیقتری تولید کند و متنهای صحیحتری ایجاد نماید؛ همچنین میتواند متنها را در سبکها، قلمها و زبانهای مختلف تولید کند.

این مدل همچنین قابلیت جستجوی وب را داراست، بهطوری که میتوانید از آن بخواهید یک دستور پخت را جستجو کند و کارتهای فلش تولید نماید.
گوگل میگوید نانو بنانا پرو برای ارائهٔ کنترل بیشتر به حرفهایها بر روی تصاویر طراحی شده است و به کاربران امکان میدهد جوانب مختلفی نظیر زاویهٔ دوربین، نورپردازی صحنه، عمق میدان، فوکوس و تنظیم رنگ را تنظیم کنند. در مقایسه با محدودیت وضوح نانو بنانا که ۱۰۲۴×۱۰۲۴ پیکسل بود، کاربران میتوانند با نانو بنانا پرو تصاویر ۲K یا ۴K تولید کنند.
شرکت اشاره کرد که هرچند نانو بنانا پرو میتواند تصاویر با کیفیت بالاتر تولید کند، اما نسبت به مدل اولیه که هزینهٔ 0.039 دلار برای هر تصویر ۱۰۲۴ پیکسل داشت، کندتر و گرانتر است. بهصورت مقایسهای، این مدل جدید برای هر تصویر 1080p یا ۲K هزینهٔ 0.139 دلار و برای هر تصویر ۴K هزینهٔ 0.24 دلار دارد.

مدل جدید میتواند از شش نما با وضوح بالا استفاده کند یا تا ۱۴ شیء را در یک تصویر ترکیب نماید. همچنین میتواند سازگاری و شباهت تا پنج نفر را حفظ کند. شرکت یک برنامهٔ نمایشی منتشر کرده است که میتوانید برخی از این قابلیتها را در آن آزمایش کنید.
نانو بنانا پرو بهصورت گستردهای در بسیاری از ابزارهای هوش مصنوعی موجود گوگل گسترش مییابد. برنامه Gemini اکنون بهصورت پیشفرض از این مدل جدید برای تولید تصاویر استفاده میکند، اگرچه کاربران در طرح اشتراک رایگان میتوانند تعداد محدودی تصویر با این مدل تولید کنند و پس از آن بهصورت پیشفرض به مدل اصلی نانو بنانا بازمیگردند.
اشتراکگذاران Google AI Plus، Pro و Ultra محدودیتهای بالاتری برای تولید تصاویر دریافت میکنند؛ اگرچه شرکت جزئیات دقیق این محدودیتها را فاش نکرده است. این کاربران همچنین دسترسی به این مدل را در NotebookLM خواهند داشت.
گوگل همچنین این مدل را از طریق حالت AI در جستجو برای مشترکین AI Pro و Ultra در ایالات متحده در دسترس قرار میدهد. مشترکین Ultra میتوانند از این مدل در ابزار ویدیویی Flow شرکت استفاده کنند و همچنین این مدل برای مشتریان Workspace در Google Slides و Vids نیز در دسترس است.
توسعهدهندگان میتوانند از نانو بنانا پرو از طریق Gemini API، Google AI Studio و IDE جدید شرکت به نام Antigravity بهرهمند شوند.
شرکت همچنین فناوری SynthID، که برای افزودن واترمارک و تشخیص تصاویر تولید شده توسط هوش مصنوعی به کار میرود، را در برنامه Gemini گنجانده است. کاربران میتوانند تصویری را بارگذاری کنند و ربات گفتوگو به آنها میگوید که آیا تصویر توسط مدلهای تصویری شرکت ساخته یا تغییر یافته است یا خیر.
گوگل گفته است که به مرور زمان، پشتیبانی از تشخیص اعتبار محتوا بر پایهٔ C2PA برای تأیید صحت محتوا اضافه خواهد شد.
این مقاله برای بازتاب دادن رویکرد گوگل در پشتیبانی از C2PA بهروز شده است.