گوگل مدل جدید تولید تصویر نانو بنانا پرو را معرفی کرد

گوگل در حال ارتقاء مدل تولید تصویر خود با قابلیت‌های جدید ویرایشی، وضوح‌های بالاتر، رندر متن دقیق‌تر و امکان جستجوی وب است.

مدل جدید که نانو بنانا پرو نام دارد، بر پایهٔ آخرین مدل زبان بزرگ گوگل، Gemini 3، که اوایل این هفته منتشر شد، ساخته شده است. این شرکت ادعا می‌کند نانو بنانا پرو نسبت به نسخهٔ پیشین خود، نانو بنانا، می‌تواند تصاویر دقیق‌تری تولید کند و متن‌های صحیح‌تری ایجاد نماید؛ همچنین می‌تواند متن‌ها را در سبک‌ها، قلم‌ها و زبان‌های مختلف تولید کند.

تصویری که توسط مدل نانو بنانا پرو گوگل ایجاد شده است؛ این یک اینفوگرافیک دربارهٔ نحوهٔ تهیهٔ چای الیچی را نشان می‌دهد. — **اعتبار تصویر:**گوگل

این مدل همچنین قابلیت جستجوی وب را داراست، به‌طوری که می‌توانید از آن بخواهید یک دستور پخت را جستجو کند و کارت‌های فلش تولید نماید.

گوگل می‌گوید نانو بنانا پرو برای ارائهٔ کنترل بیشتر به حرفه‌ای‌ها بر روی تصاویر طراحی شده است و به کاربران امکان می‌دهد جوانب مختلفی نظیر زاویهٔ دوربین، نورپردازی صحنه، عمق میدان، فوکوس و تنظیم رنگ را تنظیم کنند. در مقایسه با محدودیت وضوح نانو بنانا که ۱۰۲۴×۱۰۲۴ پیکسل بود، کاربران می‌توانند با نانو بنانا پرو تصاویر ۲K یا ۴K تولید کنند.

شرکت اشاره کرد که هرچند نانو بنانا پرو می‌تواند تصاویر با کیفیت بالاتر تولید کند، اما نسبت به مدل اولیه که هزینهٔ 0.039 دلار برای هر تصویر ۱۰۲۴ پیکسل داشت، کندتر و گران‌تر است. به‌صورت مقایسه‌ای، این مدل جدید برای هر تصویر 1080p یا ۲K هزینهٔ 0.139 دلار و برای هر تصویر ۴K هزینهٔ 0.24 دلار دارد.

مدل جدید می‌تواند از شش نما با وضوح بالا استفاده کند یا تا ۱۴ شیء را در یک تصویر ترکیب نماید. همچنین می‌تواند سازگاری و شباهت تا پنج نفر را حفظ کند. شرکت یک برنامهٔ نمایشی منتشر کرده است که می‌توانید برخی از این قابلیت‌ها را در آن آزمایش کنید.

نانو بنانا پرو به‌صورت گسترده‌ای در بسیاری از ابزارهای هوش مصنوعی موجود گوگل گسترش می‌یابد. برنامه Gemini اکنون به‌صورت پیش‌فرض از این مدل جدید برای تولید تصاویر استفاده می‌کند، اگرچه کاربران در طرح اشتراک رایگان می‌توانند تعداد محدودی تصویر با این مدل تولید کنند و پس از آن به‌صورت پیش‌فرض به مدل اصلی نانو بنانا بازمی‌گردند.

اشتراک‌گذاران Google AI Plus، Pro و Ultra محدودیت‌های بالاتری برای تولید تصاویر دریافت می‌کنند؛ اگرچه شرکت جزئیات دقیق این محدودیت‌ها را فاش نکرده است. این کاربران همچنین دسترسی به این مدل را در NotebookLM خواهند داشت.

گوگل همچنین این مدل را از طریق حالت AI در جستجو برای مشترکین AI Pro و Ultra در ایالات متحده در دسترس قرار می‌دهد. مشترکین Ultra می‌توانند از این مدل در ابزار ویدیویی Flow شرکت استفاده کنند و همچنین این مدل برای مشتریان Workspace در Google Slides و Vids نیز در دسترس است.

توسعه‌دهندگان می‌توانند از نانو بنانا پرو از طریق Gemini API، Google AI Studio و IDE جدید شرکت به نام Antigravity بهره‌مند شوند.

شرکت همچنین فناوری SynthID، که برای افزودن واترمارک و تشخیص تصاویر تولید شده توسط هوش مصنوعی به کار می‌رود، را در برنامه Gemini گنجانده است. کاربران می‌توانند تصویری را بارگذاری کنند و ربات گفت‌وگو به آن‌ها می‌گوید که آیا تصویر توسط مدل‌های تصویری شرکت ساخته یا تغییر یافته است یا خیر.

گوگل گفته است که به مرور زمان، پشتیبانی از تشخیص اعتبار محتوا بر پایهٔ C2PA برای تأیید صحت محتوا اضافه خواهد شد.

این مقاله برای بازتاب دادن رویکرد گوگل در پشتیبانی از C2PA به‌روز شده است.

دیدگاه‌ خود را بنویسید لغو پاسخ