هوش مصنوعی تصویرساز GPT-Image 1.5 معرفی شد؛ شاخ‌وشانه OpenAI برای نانو بنانا گوگل

به گزارش تیکاگو به نقل ازگجت نیوز

ارسال شده توسط: امین میانرودی 26 آذر 1404 ساعت 09:03

اوپن ای آی از مدل تصویرساز جدید GPT-Image 1.5 با قابلیت‌های خیره‌کننده در درک زبان طبیعی و رندرهای فوتوژنیک رونمایی کرد؛ رقیب جدی نانو بنانا از راه رسید.

شرکت OpenAI در اقدامی غافلگیرکننده از جدیدترین پرچمدار خود در حوزه تولید محتوای بصری پرده برداشت. این مدل که با نام مدل GPT-Image 1.5 معرفی شده، قرار است استانداردهای ساخت تصویر را جابه‌جا کند. طبق گزارش ورج، این مدل نه تنها در درک پرامپت‌های پیچیده بسیار دقیق‌تر از نسل‌های قبلی (مانند DALL-E 3) عمل می‌کند، بلکه در زمینه واقع‌گرایی و کنترل جزئیات تصویر نیز جهشی بزرگ داشته است.

هوش مصنوعی تصویرساز GPT-Image 1.5

خداحافظی با متن‌های درهم‌ریخته

یکی از بزرگترین ضعف‌های مدل‌های قبلی، ناتوانی در نوشتن صحیح متن درون تصاویر بود. اما گفته می‌شود هوش مصنوعی OpenAI در نسخه GPT-Image 1.5 این مشکل را به کلی حل کرده و اکنون کاربران می‌توانند پوسترهای تبلیغاتی و لوگوهایی با متن‌های کاملاً خوانا و دقیق تولید کنند. البته مشکل با زبان فارسی همچنان دیده می‌شود!

علاوه بر این، سرعت پردازش در این نسخه به شدت افزایش یافته و تعامل آن با ChatGPT روان‌تر از همیشه شده است تا کاربران بتوانند با زبان محاوره‌ای، تغییرات دلخواه خود را روی تصاویر اعمال کنند.

رقابت داغ با غول‌های گرافیکی

عرضه این مدل جدید، پاسخی مستقیم به پیشرفت‌های اخیر رقبایی همچون نانو بنانا (Nano Banana) گوگل، Midjourney و مدل‌های متن‌باز Flux است. OpenAI ادعا می‌کند که ساخت عکس با هوش مصنوعی توسط این مدل، حالا چنان به واقعیت نزدیک شده که تشخیص آن از عکس‌های واقعی برای چشم انسان دشوار خواهد بود. این ابزار به زودی برای کاربران سرویس‌های پلاس و اینترپرایز در دسترس قرار خواهد گرفت.

منبع