گوگل Nano Banana Pro، جدیدترین مدل تولید تصویر خود را منتشر کرد

جمی‌نی‑وودچاک
اعتبار تصویر: گوگل

گوگل مدل تولید تصویر خود را با افزودن قابلیت‌های جدید ویرایشی، وضوح بالاتر، رندر دقیق‌تر متن و امکان جستجوی وب ارتقا می‌دهد.

این مدل که با نام Nano Banana Pro شناخته می‌شود، بر پایهٔ مدل زبان بزرگ گوگل، Gemini 3، که اوایل این هفته منتشر شد، ساخته شده است. شرکت ادعا می‌کند Nano Banana Pro نسبت به پیش‌سروار خود، Nano Banana، توانایی ایجاد تصاویر دقیق‌تر و متن‌های صحیح‌تر را دارد و می‌تواند متن را در سبک‌ها، فونت‌ها و زبان‌های مختلف تولید کند.

تصویری که توسط مدل Nano Banana Pro گوگل تولید شده و اینفوگرافی‌ای دربارهٔ طرز تهیه چای الائچی را نشان می‌دهد.
اعتبار تصویر: گوگل

مدل همچنین قابلیت جستجوی وب دارد، به‌طوری‌که می‌توانید از آن بخواهید تا دستور پختی را جستجو کند و کارت‌های یادگیری تولید نماید.

گوگل می‌گوید Nano Banana Pro برای فراهم کردن کنترل بیشتر حرفه‌ای‌ها بر روی تصاویر طراحی شده است و به کاربران امکان می‌دهد جنبه‌هایی چون زاویهٔ دوربین، نورپردازی صحنه، عمق میدان، فوکوس و رنگ‌بندی را تنظیم کنند. در مقایسه با حداکثر وضوح ۱۰۲۴×۱۰۲۴ پیکسل مدل Nano Banana، کاربران می‌توانند با Nano Banana Pro تصاویر با وضوح ۲K یا ۴K تولید کنند.

شرکت اشاره کرد که اگرچه Nano Banana Pro می‌تواند تصاویر با کیفیت بالاتر تولید کند، اما نسبت به مدل اولیه که هزینهٔ هر تصویر ۱۰۲۴ پیکسلی $۰٫۰۳۹ داشت، سرعت کمتر و هزینهٔ بیشتری دارد. به‌طور مقایسه‌ای، مدل جدید برای هر تصویر ۱۰۸۰p یا ۲K هزینهٔ $۰٫۱۳۹ و برای هر تصویر ۴K هزینهٔ $۰٫۲۴ دارد.

اعتبار تصویر: گوگل

مدل جدید می‌تواند شش نما با کیفیت بالا را به‌کار گیرد یا تا ۱۴ شیء را در یک تصویر ترکیب کند. همچنین می‌تواند سازگاری و شباهت حداکثر پنج نفر را حفظ کند. شرکت یک برنامهٔ نمایشی منتشر کرده که می‌توانید برخی از این قابلیت‌ها را آزمایش کنید.

Nano Banana Pro در حال ادغام در بسیاری از ابزارهای هوش مصنوعی موجود گوگل است. برنامه Gemini از این پس به‌صورت پیش‌فرض از مدل جدید برای تولید تصویر استفاده می‌کند، هرچند کاربران در پلن رایگان می‌توانند تعداد محدودی تصویر با این مدل تولید کنند و پس از آن به مدل اصلی Nano Banana سوئیچ می‌شوند.

کاربران مشترک Google AI Plus، Pro و Ultra حدهای بالاتری برای تولید تصاویر دریافت خواهند کرد؛ جزئیات دقیق این حدود توسط شرکت فاش نشده است. این مشترکان همچنین به مدل در داخل NotebookLM دسترسی خواهند داشت.

گوگل همچنین این مدل را از طریق حالت AI در جستجو برای مشترکین AI Pro و Ultra در ایالات متحده ارائه می‌دهد. مشترکین Ultra می‌توانند این مدل را در ابزار ویدئویی Flow شرکت استفاده کنند و همچنین برای مشتریان Workspace در Google Slides و Vids در دسترس است.

توسعه‌دهندگان می‌توانند از Nano Banana Pro از طریق Gemini API، Google AI Studio و IDE جدید شرکت به نام Antigravity استفاده کنند.

شرکت همچنین فناوری SynthID خود که برای افزودن واترمارک و شناسایی تصاویر تولیدشده توسط هوش مصنوعی است، به برنامه Gemini می‌افزاید. کاربران می‌توانند تصویری آپلود کنند و ربات گفت‌وگو به آن‌ها می‌گوید آیا تصویر توسط مدل‌های تصویری شرکت ساخته یا تغییر یافته است یا خیر.

گوگل اعلام کرد که به مرور زمان پشتیبانی از تشخیص اعتبار محتوای C2PA برای تأیید صحت محتوا را اضافه خواهد کرد.

این گزارش برای بازتاب رویکرد گوگل در حمایت از C2PA به‌روز شد.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا