گوگل نانو بانانا پرو، جدیدترین مدل تولید تصویر خود را معرفی کرد

گوگل مدل تولید تصویر خود را با قابلیت‌های جدید ویرایشی، وضوح بالاتر، رندر متن دقیق‌تر و توانایی جستجو در وب ارتقا می‌دهد.

مدل جدید که با نام نانو بانانا پرو شناخته می‌شود، بر پایه آخرین مدل بزرگ زبانی گوگل، Gemini 3، که اوایل این هفته منتشر شد، ساخته شده است. شرکت ادعا می‌کند نانو بانانا پرو نسبت به پیش‌نویس خود، نانو بانانا، توانایی ایجاد تصاویر دقیق‌تر و متن‌های صحیح را دارد و می‌تواند متن را در سبک‌ها، قلم‌ها و زبان‌های مختلف تولید کند.

تصویری تولید شده توسط مدل نانو بانانا پرو گوگل که یک اینفوگرافیک دربارهٔ نحوهٔ تهیهٔ چای الیچی نشان می‌دهد. — **اعتبار تصویر:**Google

این مدل همچنین توانایی جستجو در وب را دارد؛ به‌عنوان مثال می‌توانید از آن بخواهید یک دستور غذا را پیدا کرده و کارت‌های آموزشی تولید کند.

گوگل می‌گوید نانو بانانا پرو برای ارائهٔ کنترل بیشتر به حرفه‌ای‌ها بر تصاویر طراحی شده است و به کاربران امکان تنظیم عواملی نظیر زاویهٔ دوربین، نورپردازی صحنه، عمق میدان، فوکوس و رنگ‌بندی را می‌دهد. در مقایسه با محدودیت وضوح نانو بانانا یعنی ۱۰۲۴ × ۱۰۲۴ پیکسل، کاربران می‌توانند با نانو بانانا پرو تصاویر ۲K یا ۴K تولید کنند.

شرکت اشاره کرد که اگرچه نانو بانانا پرو می‌تواند تصاویر با کیفیت بالاتر تولید کند، اما نسبت به مدل اصلی که هزینهٔ هر تصویر ۱۰۲۴ پیکسل را $0.039 داشت، کندتر و گران‌تر است. در مقایسه، مدل جدید برای هر تصویر 1080p یا ۲K هزینهٔ $0.139 و برای هر تصویر ۴K هزینهٔ $0.24 دارد.

مدل جدید می‌تواند شات‌های با دقت بالا تا شش عدد استفاده کند یا تا ۱۴ شیء را در یک تصویر ترکیب نماید. همچنین می‌تواند تا پنج نفر را با ثبات و شباهت حفظ کند. شرکت برنامهٔ نمایشی‌ای منتشر کرده است که می‌توانید برخی از این قابلیت‌ها را امتحان کنید.

نانو بانانا پرو در بسیاری از ابزارهای هوش مصنوعی موجود گوگل گسترش می‌یابد. برنامه Gemini اکنون به‌صورت پیش‌فرض از این مدل جدید برای تولید تصویر استفاده می‌کند، اگرچه کاربران در سطح رایگان می‌توانند از این مدل برای تولید تعداد محدودی تصویر بهره ببرند؛ پس از آن به‌صورت پیش‌فرض به مدل اصلی نانو بانانا باز می‌گردند.

اشتراک‌کنندگان Google AI Plus، Pro و Ultra محدودیت‌های بالاتری برای تولید دریافت می‌کنند، اگرچه شرکت جزئیات دقیق این محدودیت‌ها را فاش نکرده است. این مشترکین همچنین می‌توانند به مدل در NotebookLM دسترسی پیدا کنند.

گوگل همچنین این مدل را از طریق حالت AI در جستجو برای مشترکین AI Pro و Ultra در ایالات متحده در دسترس می‌گذارد. مشترکین Ultra می‌توانند این مدل را در ابزار ویدئویی Flow شرکت استفاده کنند و همچنین برای مشتریان Workspace در Google Slides و Vids در دسترس است.

توسعه‌دهندگان می‌توانند از نانو بانانا پرو از طریق Gemini API، Google AI Studio و IDE جدید شرکت، Antigravity، استفاده کنند.

شرکت همچنین فناوری SynthID خود، که برای افزودن واترمارک و تشخیص تصاویر تولیدی هوش مصنوعی است، در برنامه Gemini ادغام می‌کند. کاربران می‌توانند تصویری را بارگذاری کنند و ربات گفت‌وگو به آنها می‌گوید که آیا تصویر توسط مدل‌های تصویری شرکت ساخته یا ویرایش شده است یا خیر.

گوگل اعلام کرد که به‌مرور زمان پشتیبانی از تشخیص اعتبار محتوای C2PA برای تأیید محتوا را اضافه خواهد کرد.

موضوعات

هوش مصنوعی، برنامه‌ها، گوگل، تولید تصویر، نانو بانانا

دیدگاه‌ خود را بنویسید لغو پاسخ