قویتر از رقبای چینی و آمریکایی؛ علیبابا هوش مصنوعی Qwen2.5-Max را با عملکرد خیرهکننده معرفی کرد
چهارشنبه 10 بهمن 1403 - 17:03:00
|
|
پیام ویژه - دیجیاتو / شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد. براساس اعلام Alibaba، مدل جدید Qwen2.5-Max در بنچمارکهایی مانند Arena-Hard ،LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل میکند. در دیگر بنچمارکها نیز تقریباً همسطح مدل دیپسیک است. همچنین این شرکت میگوید که مدلش از GPT-4o و Llama-3.1-405B در بخشهای مختلفی عملکرد بهتری دارد. اکنون میتوانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. همچنین این مدل قدرتمند در Qwen Chat منتشر شده است که در آن میتوانید عکس و ویدیو نیز تولید کنید. مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که روی بیش از ٢٠ تریلیون توکن و با روشهای تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE کمک میکند تا #هوش_مصنوعی بدون خوشههای GPU عظیم توسعه یابد و هزینههای زیرساخت را 4٠ تا 6٠ درصد نسبت به سایر رویکردهای مدلهای زبانی بزرگ کاهش میدهد.
http://www.Yazd-Online.ir/fa/News/1558427/قویتر-از-رقبای-چینی-و-آمریکایی؛-علیبابا-هوش-مصنوعی-Qwen25-Max-را-با-عملکرد-خیرهکننده-معرفی-کرد
|