پیام ویژه

آخرين مطالب

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد خواندنی ها

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد
  بزرگنمايي:

پیام ویژه - زومیت / دیپ‌سیک نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ V3 را تحت مجوز متن‌باز MIT و با قدرت بیشتر از نسخه‌ی قبلی منتشر کرد.
دیپ‌سیک، استارتاپ پرحاشیه‌ی چینی، نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ DeepSeek-V3 را تحت مجوز متن‌باز (اوپن‌سورس) MIT منتشر کرد.
نسخه‌ی جدید در سکوت خبری منتشر شده و دیپ‌سیک هیچ بیانیه‌ای را در دسترس رسانه‌ها قرار نداده است. به‌علاوه، فایل Readme مدل جدید، فعلاً خالی است (این فایل معمولاً شامل مخازنی از کد و توضیحات مربوط‌ به تغییرات مدل می‌شود).
بازار
دیپ‌سیک V3، مدل زبانی بزرگ متن‌باز، زمستان سال گذشته در دسترس قرار گرفت و قلب تپنده‌ی دیپ‌سیک R1 به‌حساب می‌آید (R1 مدلی استدلالی است که دیپ‌سیک را بر سر زبان‌ها انداخت و حواشی گسترده‌ای را ایجاد کرد).
دیپ‌سیک V3 مدلی همه‌منظوره است که به‌طور خاص برای وظایف استدلالی بهینه نشده است، بااین‌حال می‌تواند مسائل ریاضی را حل کند و کد بنویسد.
تا به امروز، مدل V3 تحت یک مجوز سفارشی متن‌باز در دسترس بود؛ بااین‌حال به‌لطف تغییرات جدید، مدل قدرتمند دیپ‌سیک از این پس تحت مجوز MIT ارائه می‌شود. بدین ترتیب توسعه‌دهندگان می‌توانند بدون هیچ‌ محدودیتی، از این مدل هوش مصنوعی در پروژه‌های تجاری استفاده کنند و حتی سراغ اصلاح‌کردنش بروند.
کارشناسان می‌گویند مدل جدید دیپ‌سیک قدرتمندتر از نمونه‌ی قبلی شده است و منابع سخت‌افزاری کمتری را درگیر می‌کند.
اکثر مدل‌های زبانی بزرگ و پیشرفته، صرفاً با کارت‌های گرافیک کلاس دیتاسنتر پتانسیل اصلی خودشان را به‌نمایش می‌گذارند. اونی هانون، دانشمند تحقیقاتی تیم یادگیری ماشین اپل، می‌گوید که نسخه‌ی جدید دیپ‌سیک V3 را روی مک استودیو اجرا کرده و این مدل توانسته است در هر ثانیه تقریباً 20 توکن خروجی ارائه دهد که بسیار قابل توجه به نظر می‌رسد.
مک استودیو مورد استفاده، قوی‌ترین نمونه‌ی آن کامپیوتر بود و درحال‌حاضر حدود 9٬500 دلار قیمت دارد. دانشمند اپل می‌گوید اجرای دیپ‌سیک روی مک استودیو نیازمند یک‌سری تکنیک خاص ازجمله کوانتش چهار بیتی بود. این تکنیک که برای بهینه‌سازی مدل‌های زبانی بزرگ استفاده می‌شود، میزان درگیرشدن حافظه را کم می‌کند و تأخیر را پایین می‌آورد، اما بهای استفاده از آن، کاهش دقت خروجی است.
ظاهراً نسخه‌ی جدید دیپ‌سیک V3 در زمینه‌ی کدنویسی عملکرد بهتری نسبت‌ به مدل قبلی دارد. بر اساس یک تست غیررسمی و مستقل، دیپ‌سیک V3 جدید به امتیاز 60 درصد در بنچمارک دست پیدا کرد که چند درصد بهتر از نسخه‌ی قبلی است. البته دیپ‌سیک V3 جدید ضعیف‌تر از مدل استدلالی Qwen-32B ظاهر شد. V3 با وجود تمامی بهبودهایش همچنان در پشت سر مدل پرچمدار R1 قرار می‌گیرد.
مدل زبانی دیپ‌سیک V3 شامل 671 میلیارد پارامتر است، اما به هنگام پاسخ به پرسش‌ها تنها 37 میلیارد از آن‌ها را استفاده می‌کند. این ساختار غیرمنتظره، به دیپ‌سیک V3 امکان می‌دهد که عملکرد مناسب را با منابع سخت‌افزاری کمتر از سایر مدل‌های زبانی ارائه دهد (مدل‌های دیگر معمولاً تمامی پارامترهایشان را فعال می‌کنند).
دیپ‌سیک می‌گوید V3 بهینه‌تر از R1 است و هزینه‌های نهایی سازمان‌ها را پایین‌تر می‌آورد. نسخه‌ی اولیه‌ی دیپ‌سیک V3 بر پایه‌ی دیتاستی از 14٫8 تریلیون توکن آموزش داده شد.

لینک کوتاه:
https://www.payamevijeh.ir/Fa/News/1575472/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

افشاگری مهم شیخ عشیره استان الانبار عراق در مورد چهره واقعی جولانی

آیت‌الله شبیری زنجانی میزان زکات فطره را اعلام کرد

پاسخ به یک شبهه درباره دخالت رهبری در برنامه‌ریزی اقتصادی

اپل تاریخ برگزاری WWDC 2025 را اعلام کرد

انصارالله: برای آزادی هر وجب از خاک یمن تلاش خواهیم کرد

بیانیه کوتاه کاخ سفید درباره مذاکرات 12 ساعته آمریکا و روسیه در ریاض

آمار تکان‌دهنده‌ رادان؛ 30 هزار تصادف از 25 اسفند تا امروز رخ داد

خبر مهم سخنگوی دولت درباره بنزین

نسخه‌ای کمیاب از Apple-1 با قیمت 375 هزار دلار فروخته شد

تاشدنی‌های جدید سامسونگ با بتای سوم One UI 7 به ویژگی Audio Eraser مجهز می‌شوند

مقام سازمان ملل: سوریه بر سر دو راهی قرار دارد

آمریکا باز هم به یمن حمله کرد

پرچمدار بعدی اوپو باتری بسیار بزرگ‌تری خواهد داشت

حسگر اثرانگشت در اندروید 16 بدون روشن کردن صفحه‌نمایش کار خواهد کرد

معمار تحریم ایران: مسیر اختلافات واشنگتن و تهران به کجا ختم می‌شود؟

لاپید: نتانیاهو به اسرائیلی‌ها اهمیت نمی‌دهد و فقط از آنان سوء استفاده می‌کند

ویژه‌های حوادث/ قتل خونین دختر عکاس با 28 ضربه چاقو!

سامسونگ قیمت مانیتور Odyssey 3D را اعلام کرد؛ تماشای محتوای سه‌بعدی بدون عینک

رونمایی از خودروی جدید ترامپ

سردار رادان: رکورد مصرف سوخت در روزهای اخیر شکسته شد

چرا ایران باید هر دو گزینه مذاکره و جنگ را جدی بگیرد؟

روسیه: نمی‌توانیم حرف‌های زلنسکی را باور کنیم؛ لزوم ارائه تضمین‌ شفاف آتش‌بس دریایی

دیوان عالی اسرائیل نتانیاهو را نقره داغ کرد؛ برکناری رئیس شاباک رد شد

واکنش حماس به تجاوزات اسرائیل به سوریه

استان‌های رکورددار در تصادفات روزهای اخیر مشخص شد

مصرف 122 میلیون لیتر بنزین در چهارم فروردین

علت تأخیر عرضه پیکسل 9a مشکل گرمای بیش از حد این گوشی است

اسلام‌آباد: اسرائیل را به رسمیت نمی شناسیم

بودجه رژیم صهیونیستی سال 2025 تصویب شد

زمان فروش بلیت قطار‌ برای نیمه دوم فروردین 1404 اعلام شد

یاسر جبرائیلی: سیستم بانکی ما اسلام‌مالی شده نه اسلامی‌سازی!

نشنال اینترست: آیا تحریم‌های جدید ترامپ جریان نفت ایران را قطع می‌کند؟

توافق جدید روسیه و آمریکا برای ایمنی کشتیرانی در دریای سیاه

دانمارک: در مقابل فشار آمریکا مقاومت می‌کنیم

نشست سنا در پی رسوایی امنیتی؛ گفتگوی مقامات آمریکا در سینگال، مجاز یا غیرمجاز؟

معاون رئیس جمهور: متعهد به توانمندسازی زنان در سراسر کشور هستیم

هواوی حالا شرکت جدیدی برای تولید خودرو رده‌بالا دارد

یونیسف: 8 کودک در حمله آمریکا به یمن شهید شدند

لاوروف: گفتگوی آمریکا و روسیه باید احیا شود

دمشق خواستار تحقیقات بین‌المللی درباره جنایات اسرائیل در سوریه شد

خدمت در هلال احمر مصداق بارز عمل صالح است

کشف لندکروز قاچاق 100 میلیاردی در بابلسر

شورشیان سوری در برابر جنایات اسرائیل، به «مخالفت» بسنده کردند

قیمت مرغ در بازار

تهران مخوف

معمای قطر گیت، نتانیاهو چه چیزی را پنهان می‌کند؟

سد مقاومتی قیمت جهانی طلا شکست

هدست واقعیت ترکیبی ویوو رونمایی شد؛ رقیب چینی اپل ویژن پرو

حضور نتانیاهو در دیوان عالی قضایی و اصرار بر اخراج رئیس شاباک

جشنواره‌های فرهنگی و هنری رضوی؛ سفری در دنیای هنر و معنویت