اخبار هوش مصنوعی > هوش مصنوعی در جهان

راز تاریک دیپ‌سیک فاش شد /هزینه ۱/۶ میلیارد دلاری و ۵۰ هزار تراشه انویدیا برای توسعه هوش مصنوعی

به گزارش خبرگزاری خبرآنلاین و براساس گزارش زومیت، دنیای هوش مصنوعی همواره شاهد ظهور و سقوط شرکت‌های نوپا بوده است. در این میان، شرکت چینی دیپ‌سیک با ادعاهای جسورانه خود مبنی‌بر کاهش چشمگیر هزینه‌های آموزش مدل‌های هوش مصنوعی پیشرفته، توجه بسیاری را به خود جلب کرد. این شرکت مدعی بود که مدل R1 خود را با صرف تنها ۶ میلیون دلار و ۲٬۰۴۸ پردازنده گرافیکی آموزش داده است؛ درحالی‌که رقبای آمریکایی آن برای آموزش مدل‌های مشابه، میلیاردها دلار هزینه می‌کنند. آیا این ادعاها واقعیت دارند؟

بنابر گزارش مؤسسه تحقیقاتی SemiAnalysis، دیپ‌سیک برای توسعه زیرساخت‌های خود حدود ۱٫۶ میلیارد دلار هزینه کرده است و از ۵۰ هزار پردازنده گرافیکی Hopper شامل ۱۰ هزار H800 و ۱۰ هزار H100 بهره می‌برد.

آمار و ارقام مؤسسه تحقیقاتی SemiAnalysis، با ادعاهای اولیه دیپ‌سیک مبنی‌بر هزینه‌های بسیار کم آموزش مدل‌هایش در تضاد است. به نظر می‌رسد که رقم ۶ میلیون دلار فقط به بخشی از هزینه‌های آموزش، یعنی هزینه زمان پردازش گرافیکی برای مرحله پیش‌آموزش مدل اشاره کرده و هزینه‌های تحقیق، توسعه، پردازش داده‌ها و زیرساخت‌های کلی را در نظر نگرفته است.

راز تاریک دیپ‌سیک فاش شد /هزینه ۱/۶ میلیارد دلاری و ۵۰ هزار تراشه انویدیا برای توسعه هوش مصنوعی

دیپ‌سیک در واقع از شرکت سرمایه‌گذاری چینی به نام High-Flyer برخاسته که از سال‌ها پیش درزمینه هوش مصنوعی و GPU سرمایه‌گذاری‌های کلانی انجام داده است. این شرکت در سال ۲۰۲۳ دیپ‌سیک را به‌عنوان شرکت مستقل و تخصصی در حوزه هوش مصنوعی راه‌اندازی کرد.

دیپ‌سیک برخلاف بسیاری از استارت‌آپ‌های دیگر، به‌جای تکیه بر سرویس‌های ابری دیتاسنترهای اختصاصی خود را اداره می‌کند. این امر به آن امکان می‌دهد تا فرایند آزمایش و بهینه‌سازی مدل‌های هوش مصنوعی خود را کاملاً کنترل و بدون نیاز به هماهنگی با شرکت‌های دیگر، به‌سرعت تغییرات مدنظر را اعمال کند.

یکی دیگر از ویژگی‌های اصلی دیپ‌سیک جذب استعدادهای برتر از داخل چین است. این شرکت با پرداخت حقوق و مزایای رقابتی وسوسه‌کننده، متخصصان هوش مصنوعی برجسته را از دانشگاه‌های معتبر چین مانند دانشگاه پکن و دانشگاه ژجیانگ جذب می‌کند. گفته می‌شود که برخی از محققان هوش مصنوعی در دیپ‌سیک بیش از ۱٫۳ میلیون دلار حقوق سالانه دریافت می‌کنند که حتی از حقوق پرداختی شرکت‌های بزرگ هوش مصنوعی چین مانند مون‌شات بیشتر است.

دیپ‌سیک به‌جای تکیه بر افزایش مقیاس سخت‌افزار، بر بهبود الگوریتم‌ها و نوآوری‌های فنی تمرکز دارد. برای مثال، این شرکت الگوریتم Multi-Head Latent Attention (MLA) را توسعه داده که نیازمند ماه‌ها کار تحقیقاتی و استفاده بسیار زیاد از GPU بوده است. مدیرعامل دیپ‌سیک بیان می‌کند که با استفاده از رویکردهای هوشمندانه و الگوریتم‌های کارآمد، می‌توان با صرف منابع کمتر به نتایج مشابه یا حتی بهتری دست‌یافت.

بااین‌حال، موفقیت دیپ‌سیک نه‌تنها به نوآوری‌های فنی، بلکه به سرمایه‌گذاری‌های کلان و جذب استعدادهای برتر نیز وابسته است. از دیدگاه بسیاری کارشناسان حوزه‌ سخت‌افزار، ادعاهای اولیه این شرکت مبنی‌بر هزینه‌های بسیار اندک آموزش مدل‌های هوش مصنوعی تا حد زیادی جنبه تبلیغاتی داشته است و با واقعیت فاصله دارد. در واقع، دیپ‌سیک نیز مانند سایر شرکت‌های بزرگ فعال درزمینه هوش مصنوعی، برای رقابت در این عرصه نیازمند سرمایه‌گذاری‌های هنگفت و تلاش‌های بی‌وقفه است.

۲۲۷۲۲۷

منبع خبر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا