پیام ویژه

آخرين مطالب

آمازون هوش مصنوعی جدیدی برای پردازش صدای طبیعی معرفی کرد خواندنی ها

آمازون هوش مصنوعی جدیدی برای پردازش صدای طبیعی معرفی کرد
  بزرگنمايي:

پیام ویژه - زومیت / هوش مصنوعی جدید آمازون مخصوص پردازش صدا است و ادعا می‌شود که عملکردی مناسب برای رقابت با رقبا دارد.
آمازون مدل جدید هوش مصنوعی مولد خود با نام Nova Sonic را معرفی کرد؛ مدلی که توانایی پردازش صوت به‌صورت بومی و تولید گفتار طبیعی دارد. آمازون ادعا می‌کند که عملکرد Nova Sonic در زمینه‌هایی مانند سرعت و تشخیص گفتار و کیفیت مکالمه، با پیشرفته‌ترین مدل‌های صوتی OpenAI و گوگل رقابت‌کردنی است.
Nova Sonic پاسخ آمازون به مدل‌های جدید صوتی هوش مصنوعی همچون مدلی است که حالت گفتاری ChatGPT را قدرت می‌بخشد. مدل‌ها در مقایسه با نمونه‌های اولیه‌ی دستیار صوتی الکسا، بسیار طبیعی‌تر به نظر می‌رسند. پیشرفت‌های اخیر در حوزه‌ی فناوری باعث شده‌اند تا مدل‌های قدیمی و دستیارهای دیجیتال سنتی، مانند سیری اپل یا نسخه‌ی اولیه‌ی الکسا، بسیار خشک و ماشینی به نظر برسند.
بازار
Nova Sonic ازطریق پلتفرم Bedrock، بستری برای توسعه‌ی اپلیکیشن‌های هوش مصنوعی سازمانی و ازطریق API جدید دوطرفه‌ی استریم، در دسترس توسعه‌دهندگان قرار می‌گیرد. آمازون در بیانیه‌ای مطبوعاتی، Nova Sonic را «به‌صرفه‌ترین مدل صوتی هوش مصنوعی بازار» توصیف کرده و گفته است که هزینه‌ی استفاده از آن حدود 80 درصد کمتر از GPT-4o است.
بخش‌هایی از Nova Sonic اکنون در نسخه‌ی ارتقایافته‌ی دستیار صوتی آمازون با نام +Alexa به کار گرفته شده‌اند. به گفته روهیت پراساد، معاون ارشد آمازون و رئیس واحد AGI، این مدل برپایه‌ی تجربه‌ی گسترده‌ی آمازون در سیستم‌های ارکستراسیون بزرگ توسعه یافته است. این‌ها همان زیرساخت‌های فنی هستند که عملکرد الکسا را ممکن می‌کنند.
پراساد می‌گوید که Nova Sonic در هدایت درخواست‌های کاربر به APIهای مختلف عملکردی برتر دارد. این توانایی باعث می‌شود تا مدل بتواند تشخیص دهد چه زمانی باید اطلاعاتی را از اینترنت دریافت و منبع داده‌ی اختصاصی را پردازش کند یا اقدامی را در اپلیکیشن خارجی انجام دهد و ابزار مناسب برای هرکدام را به‌درستی انتخاب کند.
براساس اظهارات آمازون، در جریان مکالمه‌ی دوطرفه، Nova Sonic منتظر زمان مناسب برای پاسخ‌گویی می‌ماند و مکث‌های احتمالی در صحبت را در نظر می‌گیرد. همچنین، برای گفتار کاربران متن پیاده‌سازی‌شده (Transcript) تولید می‌کند که توسعه‌دهندگان می‌توانند از آن در کاربردهای مختلف استفاده کنند.
پراساد می‌گوید که دقت تشخیص گفتار Nova Sonic در مقایسه با بسیاری از مدل‌های صوتی هوش مصنوعی دیگر بیشتر است؛ به‌گونه‌ای که این مدل حتی در شرایطی که کاربر در صحبتش مکث می‌کند و اشتباه حرف می‌زند یا در محیطی پرسر‌وصدا قرار دارد، بازهم در تشخیص منظور کاربر عملکرد موفقی از خود نشان می‌دهد.
براساس آزمایشی با نام Multilingual LibriSpeech برای ارزیابی تشخیص گفتار در زبان‌ها و لهجه‌های مختلف، Nova Sonic به نرخ خطای کلمه‌ای (WER) برابر با 4٫2 درصد در زبان‌های انگلیسی، فرانسوی، ایتالیایی، آلمانی و اسپانیایی دست یافت. این یعنی تنها 4 کلمه از هر 100 کلمه با نسخه‌ی انسانی متفاوت بوده‌اند.

لینک کوتاه:
https://www.payamevijeh.ir/Fa/News/1579106/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

گفتگو با دزدان خانه علیرضا دبیر؛ اشتباه کردیم قصد سرقت نداشتیم!

اکبری دبیر انجمن تولیدکنندگان قند ایران: سال سخت شکری

برنامه امضای تفاهم‌نامه مشترک با دانشگاه صنعتی نوشیروانی بابل توسط بنیاد شهید و امور ایثارگران مازندران

کشف جسد دختر جوان در منطقه جنگلی

چین از ترامپ خواست دست از تهدید و باج‌گیری بردارد

اسرائیل مدعی ترور 40 نفر از سران حماس طی یک ماه اخیر شد

اسیر اسرائیلی خطاب به نتانیاهو: می‌خواهید چه بلایی بر سر ما بیاورید؟

مصدومیت 6 دانش آموز بر اثر ریزش سقف مدرسه

بیتس از کابل های شارژ مختلف با انواع رنگ‌بندی رونمایی کرد

توقیف خودروی متخلف به دلیل حرکات نامتعارف رانندگی

تا 200 میلیون تسهیلات بدون ضامن ویپاد؛ دیجیتال بانک پاسارگاد

بازدهی بورس در هفته چهارم فروردین 1404

استرداد بیش از یک میلیون قطعه اموال سرقتی به صاحبان‌شان

تناقضات درباره تعرفه خودروهای وارداتی

تکذیب خبر تعرفه واردات خودرو توسط رئیس امور اطلاع‌رسانی دولت

اسرائیل 10 اسیر اهل غزه را آزاد کرد

ونس حمله آمریکا به عراق را گردن اروپا انداخت!

آلمان: غزه متعلق به فلسطینیان است

طلا و سکه روند نزولی به خود گرفتند؛ دلار به کانال 87 هزارتومانی بازگشت

سردرگمی پادو‌های فارسی زبان ترامپ در تحلیل مذاکرات مسقط

افشای توطئه 5 مرحله‌ای اسرائیل برای پاک‌سازی غزه

روبیو و ویتکاف به پاریس می‌روند؛ اوکراین هدف گفتگوها

قصد آمریکا برای ایجاد سازوکار نظامی مشترک ترکیه و اسرائیل در سوریه

آنروا: 2.3 میلیون فلسطینی در آستانه قحطی در غزه هستند

در دیدار بارزانی و السودانی در سلیمانیه چه گذشت؟

پیام اسیر اسرائیلی به نتانیاهو: خون من گردن توست

کشف کالای قاچاق 3 میلیاردی در انبار توشه راه‌آهن

داستان سریال پایتخت در واقعیت اتفاق افتاد؛ کشف شهاب سنگ در اصفهان

قدرت‌‏های عربی این بار از توافق تهران و واشنگتن حمایت می‏‌کنند

پزشکی که 15 بیمار را به قتل رساند

دلیل اخراج 2 مقام بلند پایه پنتاگون اعلام شد

قاتل خاموش جان زن 65 ساله را گرفت

سامسونگ Auto رقیب جدید Android Auto و CarPlay اپل است

تندروها 25 درصد دارایی ایران را به باد دادند

آیین تکریم و معارفه مدیرکل بنیاد شهید و امور ایثارگران استان اردبیل برگزار شد

چشم پوشی مرکز توسعه تجارت الکترونیکی از یک تخلف بزرگ

فرصتی برای مذاکره‏‏‌کنندگان قدیمی

حدود 25 هزار نفر ساعت بر روی اصلاح قوانین ایثارگران کار کردند

رهایی 2 پسر بچه از دست گروگان‌گیران توسط پلیس

مورچه‌دزدها در کنیا محاکمه شدند

افزایش باورنکردنی تعرفه واردات خودروهای برقی و هیبریدی؛ 100 درصد!

چگونه به عمان رسیدیم

خودربایی دختر جوان برای اخاذی از خانواده و نجات پسر مورد علاقه‌اش

رفیق قالیباف، مورد قبول اصلاح‌‎طلبان؛ استاندار خراسان رضوی کیست؟

امارات قصد حمله زمینی به یمن را تکذیب کرد

تناقض در سیاست‌های تعرفه‌ای خودرو

شبکه اجتماعی OpenAI ممکن است به‌زودی به حقیقت بپیوندد

نقش‌آفرینی آژانس در معادله هسته‌ای

مادر شهیدان والامقام «کردنیرسی» از مازندران آسمانی شد

عراق سفیر لبنان را احضار کرد