غزال زیاری: کمتر از یک ماه پیش بود که مدل هوش مصنوعی چینی DeepSeek به دنیا معرفی شد و توانست برای چند روزی هم که شده لرزه بر پیکر مدلهای هوش مصنوعی غولهای پیشرو سیلیکون-ولی (یعنی ChatGPT از OpenAI، Llama محصول Meta و Claude محصول Anthropic) بیندازد.
دیپسیک خیلی سریع به پر بارگیریترین اپلیکیشن رایگان در اپاستور اپل تبدیل شد و یک تریلیون دلار از ارزشگذاری شرکتهای فناوری پیشرو آمریکا پاک شد. اما ویژگی های دیپ سیک که توانست در این مسیر ، حتی شده به صورت موقت، زلزله به پا کند چیست؟
کریستین هاموند، استاد علوم کامپیوتر دانشگاه نورث وسترن، دراینباره گفت: «این واقعیت که دیپسیک ممکن است با هزینه و محاسباتی کمتر و در زمانی کوتاهتر ساخته شده و میتوان آن را بر روی ماشینهای ارزانتری اجرا کرد، نشان میدهد که در شرایطی که همه به سمت بزرگ و بزرگتر شدن حرکت میکردیم، فرصت برای ساخت ابزاری هوشمندتر و کوچکتر را از دست دادهایم.»
آمبوج تواری استاد آمار و علوم کامپیوتر دانشگاه میشیگان نیز در این باره توضیح داد: «پیشرفتهای دیپسیک از برخی جهات بیشتر تکاملی هستند تا انقلابی؛ آنها تحت الگوی غالب مدلهای بسیار بزرگ (با ۱۰۰ میلیارد پارامتر) روی مجموعه دادههای بسیار بزرگی (تریلیون ها توکن) با بودجههای بسیار بالا کار میکنند. نوآوری اصلی در رویکرد این شرکت اینجاست که آنها چگونه از مدلهای بزرگ و قدرتمندشان بهره میبرند تا با استفاده از منابعی به مراتب کمتر، بهخوبی روی سیستمهای دیگر اجرا شوند.»
مدل دیپ سیک، دارای یک سیستم باربر همراه است که به جای اعمال جریمه کلی برای کند کردن یک سیستم پربار مثل سایر مدلها، به شکلی پویا، وظایف را از مدلهای فرعی که کار بیشتری دارند، به مدلهای کم کار منتقل میکند.
از آنجا که دسترسی چین به تراشههای پیشرفته H۱۰۰ انویدیا محدود است، دیپسیک مدعی شده که مدلهایش را با استفاده از تراشههای H۸۰۰ ساخته که سرعت انتقال داده از تراشه به تراشه در آنها کمتر است. انویدیا در سال ۲۰۲۳ این تراشه ضعیفتر را برای دور زدن کنترلهای صادرات طراحی کرده بود.
از سوی دیگر هزینههای اجرایی دیپسیک V۳ به همین منوال کمتر بوده: ۲۱ برابر ارزانتر از اجرای کلود ۳.۵ Sonnet. شرکت آنتروپیک.
یکی از کارشناسان یادآوری کرده که تحقیق و توسعه دیپسیک که شامل سختافزار و آزمونهای متعدد آزمایش و خطاست، به طور قطع خیلی بیشتر از ۵.۵۸ میلیون دلار هزینه در بر داشته ؛ اما حتی با این وجود هم کاهش هزینه قابلتوجهی در مقایسه با رقبا داشته است.
به طور کلی، کارشناسان هوش مصنوعی بر این باورند که محبوبیت دیپسیک احتمالاً امتیاز خالص مثبتی برای صنعت است که ضمن کاهش هزینههای سرسامآور منابع، باعث کاهش ممانعت ورود محققان و شرکتها در این زمینه خواهد شد و در کنار آن، فضایی را برای تراشهسازان دیگری به جز انویدیا باز میکند تا با این کمپانی بزرگ وارد رقابت شوند و تراشههایی کاربردیتر و موثرتر را به بازار عرضه کنند؛ هرچند که این خطرات خاص خودش را نیز به همراه خواهد داشت.
برای مطالعه نسخه کامل این مقاله، اینجا کلیک کنید.
۲۲۷۲۲۷