انویدیا وارد حوزه مدلهای جهانی (World Models) شده است، مدلهای هوش مصنوعی که از مدلهای ذهنی انسانی برای درک و پیشبینی جهان الهام میگیرند. در نمایشگاه CES 2025، این شرکت خانوادهای از مدلهای جهانی به نام «Cosmos World Foundation Models» یا به اختصار «Cosmos WFMs» را معرفی کرد که میتوانند ویدیوهایی با آگاهی از فیزیک، تولید و پیشبینی کنند.
جزئیات مدلهای Cosmos WFMs انویدیا
این مدلها که قابلیت تنظیم برای کاربردهای خاص دارند، از طریق API انویدیا، کاتالوگ NGC و پلتفرم توسعهدهنده AI در Hugging Face در دسترس هستند. انویدیا در یک پست وبلاگی اعلام کرده مدلهای Cosmos WFM برای شبیهسازی مبتنی بر فیزیک و تولید دادههای مصنوعی در دسترس هستند. پژوهشگران و توسعهدهندگان بدون توجه به اندازه شرکت خود میتوانند بهصورت رایگان از مدلهای کازموس (Cosmos) تحت مجوز آزاد انویدیا که اجازه استفاده تجاری را میدهد، بهرهمند شوند.
دستهبندی و ابعاد مدلهای جهانی انویدیا
خانواده Cosmos WFM شامل سه مدل نانو، برای کاربردهای با تأخیر پایین و زمان واقعی، مدل سوپر بهعنوان مدلهای استاندارد با عملکرد بالا و مدل اولترا برای خروجیهای باکیفیت و دقت حداکثری است.
همه این مدلها از نظر اندازه بین 4 میلیارد تا 14 میلیارد پارامتر، متغیر هستند. مدلهای دارای پارامترهای بیشتر، معمولاً توانایی حل مسئله پیچیده و سریعتری دارند.
انویدیا همچنین مدلهایی را برای افزایش وضوح ویدیو، تولید دادههای حسگر برای خودروهای خودران و همچنین مدلهایی برای استفاده مسئولانه منتشر کرده است. این مدلها با استفاده از ۹ هزار تریلیون توکن شامل ۲۰ میلیون ساعت داده واقعی از تعاملات انسانی، محیط، صنایع، رباتیک و دادههای مربوط به رانندگی آموزش دیدهاند.
حواشی استفاده از دادهها در این مدلها
انویدیا اعلام نکرده که این دادهها از کجا جمعآوری شدهاند. با این حال، گزارشها و شکایاتی وجود دارند که ادعا میکنند این شرکت از ویدیوهای دارای حق نشر در یوتیوب بدون اجازه استفاده کرده است. یکی از سخنگویان انویدیا در پاسخ به این اتهامات گفت:
«کازموس برای کپی یا نقض آثار محافظتشده طراحی نشده است. این مدلها مانند انسانها یاد میگیرند و ما مطمئن هستیم که استفاده ما از دادهها با روح و متن قوانین سازگار است.»
کاربردهای Cosmos WFMs
مدلهای Cosmos WFMs میتوانند با دریافت ورودیهایی مانند متن یا فریمهای ویدیو، دادههای مصنوعی کنترلشده و باکیفیت تولید کنند. این دادهها میتوانند برای آموزش مدلهای هوش مصنوعی در حوزههایی مانند رباتیک، خودروهای خودران و موارد دیگر استفاده شوند.
انویدیا در وبلاگ خود اعلام کرده مدلهای Cosmos WFM بهطور خاص برای تحقیقات و توسعه هوش مصنوعی فیزیکی طراحی شدهاند و میتوانند ویدیوهای مبتنی بر فیزیک را با ترکیبی از ورودیها مانند متن، تصویر، ویدیو و دادههای حسگر تولید کنند.
شرکتهایی مانند «Waabi» ،«Wayve» ،«Fortellix» و «Uber» متعهد شدهاند که Cosmos WFMs را برای موارد استفاده مختلف از جستجو و مرتبسازی ویدیو تا توسعه مدلهای هوش مصنوعی برای خودروهای خودران آزمایش کنند.
مدیرعامل اوبر، دارا خسروشاهی، درباره این مدلهای هوش مصنوعی اظهار داشت:
«هوش مصنوعی مولد، آینده صنعت حملونقل را رقم میزند و به دادههای غنی و توان محاسباتی بسیار قوی نیاز دارد. با همکاری انویدیا، مطمئن هستیم میتوانیم جدول زمانی برای ارائه راهحلهای ایمن و مقیاسپذیر رانندگی خودران را سرعت ببخشیم.»
نکته مهم درباره متنباز بودن مدلها
اگرچه انویدیا مدلهای Cosmos WFM را متنباز (Open Source) توصیف کرده، اما این مدلها بهمعنای واقعی کلمه متنباز نیستند. متنباز بودن به این معناست که اطلاعات کافی درباره طراحی مدل ارائه شود تا هر فردی بتواند مدل را بازسازی کند و جزئیات مربوط به دادههای آموزشی آن، از جمله منبع و نحوه دریافت یا مجوز دادهها، افشا شود.
انویدیا جزئیات کامل دادههای آموزشی مدل Cosmos WFM را منتشر نکرده و ابزارهای لازم برای بازسازی این مدلها را نیز در دسترس قرار نداده است. به همین دلیل، این مدلها بهعنوان باز و نه متنباز معرفی شدهاند.