پیام ویژه

آخرين مطالب

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد خواندنی ها

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد
  بزرگنمايي:

پیام ویژه - زومیت / دیپ‌سیک نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ V3 را تحت مجوز متن‌باز MIT و با قدرت بیشتر از نسخه‌ی قبلی منتشر کرد.
دیپ‌سیک، استارتاپ پرحاشیه‌ی چینی، نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ DeepSeek-V3 را تحت مجوز متن‌باز (اوپن‌سورس) MIT منتشر کرد.
نسخه‌ی جدید در سکوت خبری منتشر شده و دیپ‌سیک هیچ بیانیه‌ای را در دسترس رسانه‌ها قرار نداده است. به‌علاوه، فایل Readme مدل جدید، فعلاً خالی است (این فایل معمولاً شامل مخازنی از کد و توضیحات مربوط‌ به تغییرات مدل می‌شود).
بازار
دیپ‌سیک V3، مدل زبانی بزرگ متن‌باز، زمستان سال گذشته در دسترس قرار گرفت و قلب تپنده‌ی دیپ‌سیک R1 به‌حساب می‌آید (R1 مدلی استدلالی است که دیپ‌سیک را بر سر زبان‌ها انداخت و حواشی گسترده‌ای را ایجاد کرد).
دیپ‌سیک V3 مدلی همه‌منظوره است که به‌طور خاص برای وظایف استدلالی بهینه نشده است، بااین‌حال می‌تواند مسائل ریاضی را حل کند و کد بنویسد.
تا به امروز، مدل V3 تحت یک مجوز سفارشی متن‌باز در دسترس بود؛ بااین‌حال به‌لطف تغییرات جدید، مدل قدرتمند دیپ‌سیک از این پس تحت مجوز MIT ارائه می‌شود. بدین ترتیب توسعه‌دهندگان می‌توانند بدون هیچ‌ محدودیتی، از این مدل هوش مصنوعی در پروژه‌های تجاری استفاده کنند و حتی سراغ اصلاح‌کردنش بروند.
کارشناسان می‌گویند مدل جدید دیپ‌سیک قدرتمندتر از نمونه‌ی قبلی شده است و منابع سخت‌افزاری کمتری را درگیر می‌کند.
اکثر مدل‌های زبانی بزرگ و پیشرفته، صرفاً با کارت‌های گرافیک کلاس دیتاسنتر پتانسیل اصلی خودشان را به‌نمایش می‌گذارند. اونی هانون، دانشمند تحقیقاتی تیم یادگیری ماشین اپل، می‌گوید که نسخه‌ی جدید دیپ‌سیک V3 را روی مک استودیو اجرا کرده و این مدل توانسته است در هر ثانیه تقریباً 20 توکن خروجی ارائه دهد که بسیار قابل توجه به نظر می‌رسد.
مک استودیو مورد استفاده، قوی‌ترین نمونه‌ی آن کامپیوتر بود و درحال‌حاضر حدود 9٬500 دلار قیمت دارد. دانشمند اپل می‌گوید اجرای دیپ‌سیک روی مک استودیو نیازمند یک‌سری تکنیک خاص ازجمله کوانتش چهار بیتی بود. این تکنیک که برای بهینه‌سازی مدل‌های زبانی بزرگ استفاده می‌شود، میزان درگیرشدن حافظه را کم می‌کند و تأخیر را پایین می‌آورد، اما بهای استفاده از آن، کاهش دقت خروجی است.
ظاهراً نسخه‌ی جدید دیپ‌سیک V3 در زمینه‌ی کدنویسی عملکرد بهتری نسبت‌ به مدل قبلی دارد. بر اساس یک تست غیررسمی و مستقل، دیپ‌سیک V3 جدید به امتیاز 60 درصد در بنچمارک دست پیدا کرد که چند درصد بهتر از نسخه‌ی قبلی است. البته دیپ‌سیک V3 جدید ضعیف‌تر از مدل استدلالی Qwen-32B ظاهر شد. V3 با وجود تمامی بهبودهایش همچنان در پشت سر مدل پرچمدار R1 قرار می‌گیرد.
مدل زبانی دیپ‌سیک V3 شامل 671 میلیارد پارامتر است، اما به هنگام پاسخ به پرسش‌ها تنها 37 میلیارد از آن‌ها را استفاده می‌کند. این ساختار غیرمنتظره، به دیپ‌سیک V3 امکان می‌دهد که عملکرد مناسب را با منابع سخت‌افزاری کمتر از سایر مدل‌های زبانی ارائه دهد (مدل‌های دیگر معمولاً تمامی پارامترهایشان را فعال می‌کنند).
دیپ‌سیک می‌گوید V3 بهینه‌تر از R1 است و هزینه‌های نهایی سازمان‌ها را پایین‌تر می‌آورد. نسخه‌ی اولیه‌ی دیپ‌سیک V3 بر پایه‌ی دیتاستی از 14٫8 تریلیون توکن آموزش داده شد.

لینک کوتاه:
https://www.payamevijeh.ir/Fa/News/1575472/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

مرموزترین ترور اسرائیل ردیابی شد؛ ناگفته های ساعت 2 ظهر جمعه/ ویدئو

آتش‌سوزی شدید در ابوظبی

حماسه پرشور مردم مناطق روستایی و عشایری در روز جهانی قدس

اپل برنامه‌ای برای عرضه نسل جدید آیفون مینی ندارد

مرغ ترامپ یک پا دارد؛ آمریکا باید گرینلند را داشته باشد

هواوی در حال توسعه یک PC با طراحی جدید است

ترامپ، گفتگو با نخست‌وزیر کانادا را بسیار خوب توصیف کرد

ادعای آکسیوس: ترامپ طرح کوچاندن ساکنان غزه را پیگیری نمی‌کند

آنر گوشی میان‌رده جدیدی با باتری غول‌آسای 8000 میلی‌آمپرساعتی می‌سازد

یمن: در جلوگیری از دریانوردی دشمن صهیونیستی موفق عمل کردیم

رسوایی امنیتی تازه برای ارتش انگلیس

با قابلیت جدید Chatgpt جادوی استودیو جیبلی در دستان شماست!

چرا عمان، نامه ایران را تحویل آمریکایی‌ها داد؟

دیدار مدیرعامل سازمان فرهنگی، ورزشی و سیاحتی کوثر با خانواده شهید حکمت‌پناه

نینتندو سوییچ 2 نسخه‌ بهبودیافته‌ بازی‌های Switch را دریافت می‌کند

در واکنش به گاف امنیتی مقامات آمریکا، آمار دانلود پیام‌رسان سیگنال رشد کرد

پوتین درباره جنگ اوکراین پیشنهاد جدید داد

آیفون تاشو به لولای فلز مایع برای مقاومت بیشتر مجهز خواهد شد

ویژه‌های حوادث/ تجاوز شیطانی مرد کارگردان به دختران جوان!

کورنینگ گوریلا گلس سرامیک رسماً معرفی شد؛ نسل جدید شیشه محافظ صفحه‌نمایش

موتور هواپیما در پرواز تهران-کیش آتش گرفت

تصادف پژو 405، چهار فوتی برجای گذاشت

نرخ خرید تضمینی برگ سبز چای برای 1404 ابلاغ شد

کاربران واتساپ اکنون می‌توانند به استتوس خود در این پیام‌رسان موسیقی اضافه کنند

مذاکرات سران فرانسه، لبنان، سوریه، قبرس و یونان در پاریس

گرینلند ساعاتی قبل از سفر هیئت آمریکایی، دولت جدید خود را تشکیل داد

نرخ عوارض و مالیات بر ارزش افزوده سیگار وارداتی 1404 ابلاغ شد

قیمت نفت تحت تأثیر تحریم‌های ونزوئلا و ایران افزایش یافت

ماموریت سری نتانیاهو به موساد؛ یافتن وطن جایگزین برای ساکنان غزه

7 فوتی و مصدوم در پی برخورد پژو 206 با سمند

سهم بخش خصوصی از اقتصاد چقدر است؟

تاریخ عرضه بازی Shadow Labyrinth مشخص شد

دزدی به سبک اردوغان

دولت شورشی‌‌های سوریه خواستار رفع تحریم‌ها شد

ترامپ باز هم در توافق معدنی با اوکراین دبه کرد

افت 50 درصدی تولید زعفران در هر هکتار

صفحه تماس جدید شیائومی، یک کپی تمام عیار از آیفون است

5 شهید و 18 زخمی در حملات صهیونیست‌ها به لبنان

راکب موتور بر اثر برخورد با خودرو در دم جان باخت

اجرای 160 پروژه اضطراری رفع تنش آبی در کشور

سازمان ملل بار دیگر خواستار خروج اسرائیل از لبنان شد

توسعه Hogwarts Legacy: Definitive Edition و بسته الحاقی بازی لغو شد

افزایش تجرد برای اقتصاد بد است؟

تهدید رسمی انصارالله یمن علیه ابوظبی و دبی

نرخ سوخت نیروگاه‌ها 50 درصد افزایش یافت

تحریم‌های جدید آمریکا علیه حزب‌الله

ریزش کوه در حد فاصل منجیل-رودبار

چین، رهبر بی‌رقیب صادرات خودرو در جهان

تجمع اعتراضی مردم ترکیه به جنایات رژیم صهیونیستی در روز قدس

مصرف بنزین به مرز 140 میلیون لیتر رسید