
گوگل مدل تولید تصویر خود را با قابلیتهای جدید ویرایشی، وضوح بالاتر، رندر متن دقیقتر و توانایی جستجو در وب ارتقا میدهد.
مدل جدید که با نام نانو بانانا پرو شناخته میشود، بر پایه آخرین مدل بزرگ زبانی گوگل، Gemini 3، که اوایل این هفته منتشر شد، ساخته شده است. شرکت ادعا میکند نانو بانانا پرو نسبت به پیشنویس خود، نانو بانانا، توانایی ایجاد تصاویر دقیقتر و متنهای صحیح را دارد و میتواند متن را در سبکها، قلمها و زبانهای مختلف تولید کند.

این مدل همچنین توانایی جستجو در وب را دارد؛ بهعنوان مثال میتوانید از آن بخواهید یک دستور غذا را پیدا کرده و کارتهای آموزشی تولید کند.
گوگل میگوید نانو بانانا پرو برای ارائهٔ کنترل بیشتر به حرفهایها بر تصاویر طراحی شده است و به کاربران امکان تنظیم عواملی نظیر زاویهٔ دوربین، نورپردازی صحنه، عمق میدان، فوکوس و رنگبندی را میدهد. در مقایسه با محدودیت وضوح نانو بانانا یعنی ۱۰۲۴ × ۱۰۲۴ پیکسل، کاربران میتوانند با نانو بانانا پرو تصاویر ۲K یا ۴K تولید کنند.
شرکت اشاره کرد که اگرچه نانو بانانا پرو میتواند تصاویر با کیفیت بالاتر تولید کند، اما نسبت به مدل اصلی که هزینهٔ هر تصویر ۱۰۲۴ پیکسل را $0.039 داشت، کندتر و گرانتر است. در مقایسه، مدل جدید برای هر تصویر 1080p یا ۲K هزینهٔ $0.139 و برای هر تصویر ۴K هزینهٔ $0.24 دارد.

مدل جدید میتواند شاتهای با دقت بالا تا شش عدد استفاده کند یا تا ۱۴ شیء را در یک تصویر ترکیب نماید. همچنین میتواند تا پنج نفر را با ثبات و شباهت حفظ کند. شرکت برنامهٔ نمایشیای منتشر کرده است که میتوانید برخی از این قابلیتها را امتحان کنید.
نانو بانانا پرو در بسیاری از ابزارهای هوش مصنوعی موجود گوگل گسترش مییابد. برنامه Gemini اکنون بهصورت پیشفرض از این مدل جدید برای تولید تصویر استفاده میکند، اگرچه کاربران در سطح رایگان میتوانند از این مدل برای تولید تعداد محدودی تصویر بهره ببرند؛ پس از آن بهصورت پیشفرض به مدل اصلی نانو بانانا باز میگردند.
اشتراککنندگان Google AI Plus، Pro و Ultra محدودیتهای بالاتری برای تولید دریافت میکنند، اگرچه شرکت جزئیات دقیق این محدودیتها را فاش نکرده است. این مشترکین همچنین میتوانند به مدل در NotebookLM دسترسی پیدا کنند.
گوگل همچنین این مدل را از طریق حالت AI در جستجو برای مشترکین AI Pro و Ultra در ایالات متحده در دسترس میگذارد. مشترکین Ultra میتوانند این مدل را در ابزار ویدئویی Flow شرکت استفاده کنند و همچنین برای مشتریان Workspace در Google Slides و Vids در دسترس است.
توسعهدهندگان میتوانند از نانو بانانا پرو از طریق Gemini API، Google AI Studio و IDE جدید شرکت، Antigravity، استفاده کنند.
شرکت همچنین فناوری SynthID خود، که برای افزودن واترمارک و تشخیص تصاویر تولیدی هوش مصنوعی است، در برنامه Gemini ادغام میکند. کاربران میتوانند تصویری را بارگذاری کنند و ربات گفتوگو به آنها میگوید که آیا تصویر توسط مدلهای تصویری شرکت ساخته یا ویرایش شده است یا خیر.
گوگل اعلام کرد که بهمرور زمان پشتیبانی از تشخیص اعتبار محتوای C2PA برای تأیید محتوا را اضافه خواهد کرد.
موضوعات
هوش مصنوعی، برنامهها، گوگل، تولید تصویر، نانو بانانا