
نگار علی- شرکت میدجرنی، از پیشگامان تولید تصاویر هوش مصنوعی، پس از بیش از یک سال اولین مدل کاملاً بازطراحی شده خود به نام V7 را معرفی کرد. این مدل که هم اکنون در نسخه آلفا در دسترس کاربران قرار گرفته، دو حوزه کلیدی را بهبود بخشیده است: کیفیت تصاویر و ابزارهای تولید محتوا.
در بخش کیفیت تصاویر، V7 پیشرفت چشمگیری در تولید جزئیات واقعگرایانه نشان میدهد. این مدل اکنون قادر است دستها، انگشتان و اعضای بدن را با یکپارچگی و ثبات بیشتری تولید کند. همچنین بافتهای پیچیدهای مانند چینوچروک پوست یا ظرافتهای یک گلدان سفالی را با دقت بالاتری پردازش مینماید. اگرچه این تصاویر هنوز برای چشم آموزش دیده قابل تشخیص هستند، اما بسیاری از خطاهای رایج در نسخههای قبلی به میزان قابل توجهی کاهش یافتهاند.
یکی از جذابترین ویژگیهای جدید، «حالت پیشنویس» (Draft Mode) است که میتواند تصاویر را با ۱۰ برابر سرعت بیشتر و نصف هزینه نسخههای قبلی تولید کند. کاربران همچنین میتوانند بین دو حالت توربو (پردازش سریع با هزینه بیشتر) و ریلکس (پردازش آهستهتر با هزینه کمتر) انتخاب کنند.
ویژگی منحصر به فرد دیگر در V7، سیستم شخصیسازی پیشفرض است. برخلاف نسخههای قبلی که این قابلیت اختیاری بود، کاربران اکنون باید مدل را با انتخاب حداقل ۲۰۰ تصویر آموزش دهند تا مطابق سلیقه آنها عمل کند. این سیستم با نمایش جفت تصاویر و درخواست انتخاب ترجیحی کاربر، به مرور سبک هنری مورد نظر را یاد میگیرد.
میدجرنی که همچنان یکی از محبوبترین ابزارهای تولید تصویر هوش مصنوعی محسوب میشود، نقش مهمی در گردش کار بسیاری از هنرمندان دیجیتال و سازندگان محتوای ویدیویی ایفا میکند. با وجود چالشهای حقوقی مربوط به استفاده از آثار دارای حق نشر برای آموزش مدل، این شرکت به توسعه محصول خود ادامه داده و حتی از برنامههای آینده برای تولید سختافزار اختصاصی خبر داده است.
مدل V7 با حفظ سازگاری با پارامترهای نسخههای قبلی (مانند نسبت ابعاد و کدهای مرجع سبک)، تجربه کاربری روانتری را ارائه میدهد. این بهروزرسانی میتواند موقعیت میدجرنی را در رقابت فشرده با رقبایی مانند DALL-E 3 و Stable Diffusion تقویت کند و استانداردهای جدیدی را در صنعت تولید تصاویر هوش مصنوعی تعیین نماید.
منبع: arstechnica
۲۲۷۲۲۷