دیگر خبری از دست‌های ناقص نیست /تولید تصاویر واقع‌گرا با میدجرنی V7

نگار علی- شرکت میدجرنی، از پیشگامان تولید تصاویر هوش مصنوعی، پس از بیش از یک سال اولین مدل کاملاً بازطراحی شده خود به نام V7 را معرفی کرد. این مدل که هم اکنون در نسخه آلفا در دسترس کاربران قرار گرفته، دو حوزه کلیدی را بهبود بخشیده است: کیفیت تصاویر و ابزارهای تولید محتوا.

در بخش کیفیت تصاویر، V7 پیشرفت چشمگیری در تولید جزئیات واقع‌گرایانه نشان می‌دهد. این مدل اکنون قادر است دست‌ها، انگشتان و اعضای بدن را با یکپارچگی و ثبات بیشتری تولید کند. همچنین بافت‌های پیچیده‌ای مانند چین‌وچروک پوست یا ظرافت‌های یک گلدان سفالی را با دقت بالاتری پردازش می‌نماید. اگرچه این تصاویر هنوز برای چشم آموزش دیده قابل تشخیص هستند، اما بسیاری از خطاهای رایج در نسخه‌های قبلی به میزان قابل توجهی کاهش یافته‌اند.

یکی از جذاب‌ترین ویژگی‌های جدید، «حالت پیش‌نویس» (Draft Mode) است که می‌تواند تصاویر را با ۱۰ برابر سرعت بیشتر و نصف هزینه نسخه‌های قبلی تولید کند. کاربران همچنین می‌توانند بین دو حالت توربو (پردازش سریع با هزینه بیشتر) و ریلکس (پردازش آهسته‌تر با هزینه کمتر) انتخاب کنند.

ویژگی منحصر به فرد دیگر در V7، سیستم شخصی‌سازی پیش‌فرض است. برخلاف نسخه‌های قبلی که این قابلیت اختیاری بود، کاربران اکنون باید مدل را با انتخاب حداقل ۲۰۰ تصویر آموزش دهند تا مطابق سلیقه آنها عمل کند. این سیستم با نمایش جفت تصاویر و درخواست انتخاب ترجیحی کاربر، به مرور سبک هنری مورد نظر را یاد می‌گیرد.

میدجرنی که همچنان یکی از محبوب‌ترین ابزارهای تولید تصویر هوش مصنوعی محسوب می‌شود، نقش مهمی در گردش کار بسیاری از هنرمندان دیجیتال و سازندگان محتوای ویدیویی ایفا می‌کند. با وجود چالش‌های حقوقی مربوط به استفاده از آثار دارای حق نشر برای آموزش مدل، این شرکت به توسعه محصول خود ادامه داده و حتی از برنامه‌های آینده برای تولید سخت‌افزار اختصاصی خبر داده است.

مدل V7 با حفظ سازگاری با پارامترهای نسخه‌های قبلی (مانند نسبت ابعاد و کدهای مرجع سبک)، تجربه کاربری روان‌تری را ارائه می‌دهد. این به‌روزرسانی می‌تواند موقعیت میدجرنی را در رقابت فشرده با رقبایی مانند DALL-E 3 و Stable Diffusion تقویت کند و استانداردهای جدیدی را در صنعت تولید تصاویر هوش مصنوعی تعیین نماید.

منبع: arstechnica

۲۲۷۲۲۷

منبع خبر