صنعت هوش مصنوعی آمریکا پس از عرضه نسخه بهروزرسانیشده ربات چت یک شرکت کوچک چینی به نام دیپسیک در هفته گذشته، دچار شوک شد. این ربات عملکردی فراتر از آخرین نسخه ChatGPT ارائه داده است.
اما تنها عملکرد دیپسیک نیست که غولهای هوش مصنوعی آمریکا را نگران کرده است. نکته قابلتوجه این است که دیپسیک مدل خود را در مدت چند ماه، با استفاده از سختافزاری معمولی و با هزینهای ناچیز ساخته است، چیزی که قبلاً تقریباً غیرقابلتصور بود. در ادامه، اطلاعات بیشتری در مورد دیپسیک ارائه میشود.
دیپسیک چیست؟
دیپسیک یک آزمایشگاه هوش مصنوعی در چین است که در سال ۲۰۲۳ در شهر هانگژو، استان ژجیانگ، تأسیس شده است. این شرکت مدل هوش مصنوعی متنباز خود به نام دیپسیک را عرضه کرده است. نسخه جدید آن، DeepSeek-V3، عملکردی رقابتی یا حتی بهتر از ChatGPT، شامل مدل GPT-4o و مدل استدلالی جدید o1 ارائه داده است.
اما اینکه ربات چت DeepSeek-V3 میتواند از ChatGPT، Llama 3.1 متا و Claude Sonnet 3.5 شرکت Anthropic پیشی بگیرد، تنها نکته نگرانکننده برای متخصصان هوش مصنوعی آمریکا نیست. موضوعی که باعث تعجب شده، این است که این مدل تنها در چند ماه ساخته شده و از سختافزاری استفاده کرده که پیشرفته نیست، با هزینهای بسیار کمتر از سایر شرکتهایی که مدلهای زبانی بزرگ خود را توسعه دادهاند.
هزینه توسعه دیپسیک چقدر بوده است؟
شاید شگفتانگیزترین نکته در مورد دیپسیک، هزینه ساخت آن باشد. طبق گزارش فنی این شرکت درباره DeepSeek-V3، کل هزینه توسعه این مدل تنها ۵.۵۷۶ میلیون دلار آمریکا بوده است.
دیپسیک توانسته است با کمتر از ۶ میلیون دلار، یک مدل زبانی بزرگ ایجاد کند، درحالیکه سایر شرکتها میلیاردها دلار برای توسعه مدلهای خود خرج کردهاند. (طبق گزارش Wired در سال ۲۰۲۳، تنها برای آموزش GPT-4، شرکت OpenAI حدود ۱۰۰ میلیون دلار هزینه کرده است.)
این موضوع سوالات جدیای را برای غولهای فناوری آمریکا مطرح میکند، از جمله اینکه آیا آنها میلیاردها دلار برای توسعه مدلهای زبانی بزرگ خود هزینههای غیرضروری انجام دادهاند؟
چرا موفقیت دیپسیک نگرانکننده است؟
هزینه بالای تحقیق و توسعه باعث شده اکثر مدلهای زبانی بزرگ برای شرکتها سودآوری نداشته باشند. اگر شرکتهای آمریکایی میتوانستند این مدلها را تنها با چند میلیون دلار توسعه دهند، میلیاردها دلار را بیهوده هدر دادهاند.
علاوه بر این، ساخت مدلی پیشرفته توسط دیپسیک با هزینه کمتر از ۶ میلیون دلار، نگرانیهای رقابتی جدیای ایجاد کرده است. در گذشته، تصور میشد که ساخت مدلهای زبانی بزرگ به صدها میلیون یا میلیاردها دلار نیاز دارد، که این موضوع مزیت مالی قابلتوجهی برای شرکتهای بزرگ آمریکایی مانند متا، گوگل و OpenAI ایجاد کرده بود.
اما اگر دیپسیک توانسته با ۶ میلیون دلار مدل خود را بسازد، غولهای فناوری آمریکا ممکن است بهزودی با رقابت شدیدتری از سوی استارتآپهای کوچک نهتنها در آمریکا بلکه در سراسر جهان مواجه شوند.
آیا آمریکا نباید از پیشرفت شرکتهای چینی در هوش مصنوعی جلوگیری میکرد؟
بله. دولت بایدن محدودیتهایی در صادرات فناوریهای هوش مصنوعی اعمال کرد تا از پیشرفت شرکتهای چینی در این حوزه جلوگیری کند. برخی از این محدودیتها فروش پیشرفتهترین تراشههای هوش مصنوعی به شرکتهای چینی را ممنوع کردند. تراشههای پیشرفته انویدیا شامل این محدودیتها بودند.
این موفقیت دیپسیک را حتی شوکهکنندهتر میکند. این مدل با استفاده از تراشههای H800 انویدیا، یک تراشه میانرده هوش مصنوعی، توسعه یافته است.
با وجود استفاده از سختافزار غیرپیشرفته، دیپسیک مدلی ساخته است که از ChatGPT برتر است و همچنین از لحاظ مصرف انرژی کارآمدتر از مدلهایی مانند ChatGPT است، که این موضوع به نفع محیطزیست است.
آراویند سرینیواس، مدیرعامل شرکت Perplexity، در مصاحبهای با CNBC درباره پیشرفتهای دیپسیک گفت: «ضرورت ما،در اختراع است. چون مجبور بودند راهحلهای جایگزین پیدا کنند، در نهایت چیزی بسیار کارآمدتر ساختند.»
واکنش غولهای هوش مصنوعی آمریکا به دیپسیک چگونه بوده است؟
این موفقیت با شوک و نگرانی مواجه شده است. ساتیا نادلا، مدیرعامل مایکروسافت، در مجمع جهانی اقتصاد در داووس، سوئیس، گفت: «دیدن مدل جدید دیپسیک، از نظر انجام محاسبات کارآمد و متنباز بودن، بسیار چشمگیر است. باید پیشرفتهای چین را بسیار جدی بگیریم.»
مایکروسافت میلیاردها دلار در OpenAI سرمایهگذاری کرده است.
یان لوکان، دانشمند ارشد هوش مصنوعی متا، نظر متفاوتی دارد. او در Threads نوشت: «موفقیت دیپسیک نشان میدهد مدلهای متنباز در حال پیشی گرفتن از مدلهای اختصاصی هستند.»
او ادامه داد: «دیپسیک از تحقیقات و منابع متنباز (مانند PyTorch و Llama از متا) استفاده کرده است. آنها ایدههای جدیدی ارائه داده و بر اساس کار دیگران ساختهاند. چون کار آنها منتشر و متنباز است، همه میتوانند از آن بهره ببرند. این قدرت تحقیق و متنباز بودن است.»
واکنش سرمایهگذاران به خبر دیپسیک چگونه بوده است؟
این خبر باعث نگرانی سرمایهگذاران شده است. در زمان نگارش این مقاله، سهام شرکتهای مرتبط با هوش مصنوعی با کاهش ارزش روبرو شدهاند.
- سهام شرکت NVIDIA Corporation (نماد: NVDA) بیش از ۱۰٪ کاهش یافته است. موفقیت انویدیا در سالهای اخیر به دلیل فروش تراشههای پیشرفته هوش مصنوعی بوده است. اما اگر شرکتها بتوانند مدلهای پیشرفتهتری را با سختافزارهای متوسط بسازند، این موضوع چه تاثیری بر درآمد آینده انویدیا خواهد داشت؟
- سهام شرکت ASML Holding N.V. (نماد: ASML)، سازنده تجهیزات موردنیاز برای تولید تراشههای هوش مصنوعی پیشرفته، نیز ۹٪ کاهش داشته است.
- سهام شرکت Microsoft Corporation (نماد: MSFT)، بزرگترین سرمایهگذار OpenAI، بیش از ۶٪ کاهش یافته است.
آیا میتوان از دیپسیک استفاده کرد؟
بله. استفاده از دیپسیک رایگان است—هیچ هزینهای برای استفاده از DeepSeek-V3 وجود ندارد، مدلی که در اکثر آزمایشها از مدل o1 ChatGPT پیشی گرفته است. مدل اخیر هزینهای معادل ۲۰۰ دلار در ماه دارد.
دیپسیک را میتوان رایگان در وب استفاده کرد. رابط کاربری آن مشابه سایر مدلهای زبانی بزرگ است.
همچنین میتوانید از اپلیکیشن اختصاصی دیپسیک برای iOS و اندروید استفاده کنید.
و به عنوان نشانهای از محبوبیت دیپسیک در بازار هوش مصنوعی طی روزهای اخیر، این اپلیکیشن اکنون اپ شماره ۱ در اپاستور اپل است.