
گوگل مدل تولید تصویر خود را با افزودن قابلیتهای جدید ویرایشی، وضوح بالاتر، رندر دقیقتر متن و امکان جستجوی وب ارتقا میدهد.
این مدل که با نام Nano Banana Pro شناخته میشود، بر پایهٔ مدل زبان بزرگ گوگل، Gemini 3، که اوایل این هفته منتشر شد، ساخته شده است. شرکت ادعا میکند Nano Banana Pro نسبت به پیشسروار خود، Nano Banana، توانایی ایجاد تصاویر دقیقتر و متنهای صحیحتر را دارد و میتواند متن را در سبکها، فونتها و زبانهای مختلف تولید کند.

مدل همچنین قابلیت جستجوی وب دارد، بهطوریکه میتوانید از آن بخواهید تا دستور پختی را جستجو کند و کارتهای یادگیری تولید نماید.
گوگل میگوید Nano Banana Pro برای فراهم کردن کنترل بیشتر حرفهایها بر روی تصاویر طراحی شده است و به کاربران امکان میدهد جنبههایی چون زاویهٔ دوربین، نورپردازی صحنه، عمق میدان، فوکوس و رنگبندی را تنظیم کنند. در مقایسه با حداکثر وضوح ۱۰۲۴×۱۰۲۴ پیکسل مدل Nano Banana، کاربران میتوانند با Nano Banana Pro تصاویر با وضوح ۲K یا ۴K تولید کنند.
شرکت اشاره کرد که اگرچه Nano Banana Pro میتواند تصاویر با کیفیت بالاتر تولید کند، اما نسبت به مدل اولیه که هزینهٔ هر تصویر ۱۰۲۴ پیکسلی $۰٫۰۳۹ داشت، سرعت کمتر و هزینهٔ بیشتری دارد. بهطور مقایسهای، مدل جدید برای هر تصویر ۱۰۸۰p یا ۲K هزینهٔ $۰٫۱۳۹ و برای هر تصویر ۴K هزینهٔ $۰٫۲۴ دارد.

مدل جدید میتواند شش نما با کیفیت بالا را بهکار گیرد یا تا ۱۴ شیء را در یک تصویر ترکیب کند. همچنین میتواند سازگاری و شباهت حداکثر پنج نفر را حفظ کند. شرکت یک برنامهٔ نمایشی منتشر کرده که میتوانید برخی از این قابلیتها را آزمایش کنید.
Nano Banana Pro در حال ادغام در بسیاری از ابزارهای هوش مصنوعی موجود گوگل است. برنامه Gemini از این پس بهصورت پیشفرض از مدل جدید برای تولید تصویر استفاده میکند، هرچند کاربران در پلن رایگان میتوانند تعداد محدودی تصویر با این مدل تولید کنند و پس از آن به مدل اصلی Nano Banana سوئیچ میشوند.
کاربران مشترک Google AI Plus، Pro و Ultra حدهای بالاتری برای تولید تصاویر دریافت خواهند کرد؛ جزئیات دقیق این حدود توسط شرکت فاش نشده است. این مشترکان همچنین به مدل در داخل NotebookLM دسترسی خواهند داشت.
گوگل همچنین این مدل را از طریق حالت AI در جستجو برای مشترکین AI Pro و Ultra در ایالات متحده ارائه میدهد. مشترکین Ultra میتوانند این مدل را در ابزار ویدئویی Flow شرکت استفاده کنند و همچنین برای مشتریان Workspace در Google Slides و Vids در دسترس است.
توسعهدهندگان میتوانند از Nano Banana Pro از طریق Gemini API، Google AI Studio و IDE جدید شرکت به نام Antigravity استفاده کنند.
شرکت همچنین فناوری SynthID خود که برای افزودن واترمارک و شناسایی تصاویر تولیدشده توسط هوش مصنوعی است، به برنامه Gemini میافزاید. کاربران میتوانند تصویری آپلود کنند و ربات گفتوگو به آنها میگوید آیا تصویر توسط مدلهای تصویری شرکت ساخته یا تغییر یافته است یا خیر.
گوگل اعلام کرد که به مرور زمان پشتیبانی از تشخیص اعتبار محتوای C2PA برای تأیید صحت محتوا را اضافه خواهد کرد.
این گزارش برای بازتاب رویکرد گوگل در حمایت از C2PA بهروز شد.