پیام ویژه

آخرين مطالب

آمازون هوش مصنوعی جدیدی برای پردازش صدای طبیعی معرفی کرد خواندنی ها

آمازون هوش مصنوعی جدیدی برای پردازش صدای طبیعی معرفی کرد
  بزرگنمايي:

پیام ویژه - زومیت / هوش مصنوعی جدید آمازون مخصوص پردازش صدا است و ادعا می‌شود که عملکردی مناسب برای رقابت با رقبا دارد.
آمازون مدل جدید هوش مصنوعی مولد خود با نام Nova Sonic را معرفی کرد؛ مدلی که توانایی پردازش صوت به‌صورت بومی و تولید گفتار طبیعی دارد. آمازون ادعا می‌کند که عملکرد Nova Sonic در زمینه‌هایی مانند سرعت و تشخیص گفتار و کیفیت مکالمه، با پیشرفته‌ترین مدل‌های صوتی OpenAI و گوگل رقابت‌کردنی است.
Nova Sonic پاسخ آمازون به مدل‌های جدید صوتی هوش مصنوعی همچون مدلی است که حالت گفتاری ChatGPT را قدرت می‌بخشد. مدل‌ها در مقایسه با نمونه‌های اولیه‌ی دستیار صوتی الکسا، بسیار طبیعی‌تر به نظر می‌رسند. پیشرفت‌های اخیر در حوزه‌ی فناوری باعث شده‌اند تا مدل‌های قدیمی و دستیارهای دیجیتال سنتی، مانند سیری اپل یا نسخه‌ی اولیه‌ی الکسا، بسیار خشک و ماشینی به نظر برسند.
بازار
Nova Sonic ازطریق پلتفرم Bedrock، بستری برای توسعه‌ی اپلیکیشن‌های هوش مصنوعی سازمانی و ازطریق API جدید دوطرفه‌ی استریم، در دسترس توسعه‌دهندگان قرار می‌گیرد. آمازون در بیانیه‌ای مطبوعاتی، Nova Sonic را «به‌صرفه‌ترین مدل صوتی هوش مصنوعی بازار» توصیف کرده و گفته است که هزینه‌ی استفاده از آن حدود 80 درصد کمتر از GPT-4o است.
بخش‌هایی از Nova Sonic اکنون در نسخه‌ی ارتقایافته‌ی دستیار صوتی آمازون با نام +Alexa به کار گرفته شده‌اند. به گفته روهیت پراساد، معاون ارشد آمازون و رئیس واحد AGI، این مدل برپایه‌ی تجربه‌ی گسترده‌ی آمازون در سیستم‌های ارکستراسیون بزرگ توسعه یافته است. این‌ها همان زیرساخت‌های فنی هستند که عملکرد الکسا را ممکن می‌کنند.
پراساد می‌گوید که Nova Sonic در هدایت درخواست‌های کاربر به APIهای مختلف عملکردی برتر دارد. این توانایی باعث می‌شود تا مدل بتواند تشخیص دهد چه زمانی باید اطلاعاتی را از اینترنت دریافت و منبع داده‌ی اختصاصی را پردازش کند یا اقدامی را در اپلیکیشن خارجی انجام دهد و ابزار مناسب برای هرکدام را به‌درستی انتخاب کند.
براساس اظهارات آمازون، در جریان مکالمه‌ی دوطرفه، Nova Sonic منتظر زمان مناسب برای پاسخ‌گویی می‌ماند و مکث‌های احتمالی در صحبت را در نظر می‌گیرد. همچنین، برای گفتار کاربران متن پیاده‌سازی‌شده (Transcript) تولید می‌کند که توسعه‌دهندگان می‌توانند از آن در کاربردهای مختلف استفاده کنند.
پراساد می‌گوید که دقت تشخیص گفتار Nova Sonic در مقایسه با بسیاری از مدل‌های صوتی هوش مصنوعی دیگر بیشتر است؛ به‌گونه‌ای که این مدل حتی در شرایطی که کاربر در صحبتش مکث می‌کند و اشتباه حرف می‌زند یا در محیطی پرسر‌وصدا قرار دارد، بازهم در تشخیص منظور کاربر عملکرد موفقی از خود نشان می‌دهد.
براساس آزمایشی با نام Multilingual LibriSpeech برای ارزیابی تشخیص گفتار در زبان‌ها و لهجه‌های مختلف، Nova Sonic به نرخ خطای کلمه‌ای (WER) برابر با 4٫2 درصد در زبان‌های انگلیسی، فرانسوی، ایتالیایی، آلمانی و اسپانیایی دست یافت. این یعنی تنها 4 کلمه از هر 100 کلمه با نسخه‌ی انسانی متفاوت بوده‌اند.

لینک کوتاه:
https://www.payamevijeh.ir/Fa/News/1579106/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

ضرب‌ و شتم دانشجویان معترض حامی فلسطین در دانشگاه آمستردام هلند

دولت ترامپ کمک 2.2 میلیارد دلاری به دانشگاه هاروارد را تعلیق کرد

سرمقاله خراسان/ قره قوم، کارویژه دیپلماسی استانی شود

ثبات شکننده شبکه بانکی

مشخصات کلیدی موتورولا Razr Plus (2025) در بنچمارک گیک‌بنچ مشاهده شد

میرسلیم: ترامپ ضمانت نمی دهد مگر از عاقبت نفرت انگیزش در قیامت بترسد

اگر فراموش نکنیم ترامپ با خروج از برجام چه شرایطی رقم زد، دیگر دم از مذاکره نخواهیم زد

بازی Prince of Persia: The Lost Crown برای اندروید و iOS منتشر شد

خیز بن‌سلمان برای هسته‌ای شدن؟

زنی متوهم که تاثیر وحشتناکی بر ترامپ دارد

حرکت در مسیر عقلانیت؛ یک سال پس از وعده صادق1

دیپلمات پیشین: شرایط برای توافق ایران و آمریکا مهیاست

سخنگوی دولت اصلاحات: از ترس شکست نباید مذاکرات را متوقف کرد

رویداد مسقط از پس ژرفای تاریخ

هکرها صدای جعلی ایلان ماسک و مارک زاکربرگ را در تقاطع‌های کالیفرنیا پخش کردند

ارزان شدن موبایل در ایران؛ تأثیر مذاکرات و کاهش نرخ دلار بر بازار گوشی

تقویت ریال با مذاکره

هسته سخت نظام علیه نظام؟

ترامپ به سی ان ان: دیگه اصلا اعتباری ندارین!

جزئیات طرح زیاده‌خواهانه اسرائیل برای توقف دائمی جنگ غزه

حکم معلم‌ خاطی مدرسه سنندج تعلیق شد

ملاک دهک بندی خانوارها چیست؟

برخی کاربران از لرزش شدید دوربین فوق‌عریض گلکسی S25 اولترا گزارش می‌دهند

آیفون 17 پرو مکس را ساختیم؛ نگاه نزدیک به پرچمدار 2025 اپل!

رفتار عجیب ترامپ در حضور نوه‌اش

اوضاع انسانی وخیم در نوار غزه

کنایه سنگین ترامپ به زلنسکی: او جنگ را شروع کرد، سپس برای موشک، التماس کرد

پسر جوان، مظنون اصلی سقوط مرگبار دختر آرایشگر

‌قتل زن سالخوره با ضربه پیک نیک

پیش بینی قیمت طلا و سکه 26 فروردین 1404

رسانه عبری: اسرائیل اشغال خشونت باری در جنوب سوریه دارد

انتشار تصاویر هدف قرار دادن تک‌تیرانداز اسرائیل در شرق غزه

ابراز شگفتی حماس از پیشنهاد مصر برای خلع سلاح مقاومت

معمای 16 ساله درباره ضربه مرگبار در درگیری خیابانی

اولین یارانه نقدی 1404 واریز شد

وضعیت عجیب درب دانشکده علوم سیاسی دانشگاه تهران و پرچم آمریکا/ تصاویر

ترامپ به شکست از چین اعتراف کرد

می‌توان به هر شهروند روزانه یک لیتر بنزین اختصاص داد

دست قوه قضائیه برای برخورد با ابر بدهکاران بانکی بازتر شد

ماجرای دیوید کاپرفیلد، سرکرده باند دزدان پایتخت چه بود؟

تریلر بازی Fatal Fury: City of the Wolves سبک مبارزه هوکوتومارو را نشان می‌دهد

رسوایی جدید نتانیاهو؛ اسراری که سارا در مهمانی زنانه فاش کرد

حماس: اسرائیل خواهان آزادی نیمی از اسرای خود در هفته اول توافق است

هوای تهران تا آخر هفته بارانی است

ماشین شما به پلیس وصل می‌شود!

ویدیو لورفته از وان‌پلاس 13T، طراحی متفاوت پرچمدار جمع‌وجور چینی‌ها را نشان می‌دهد

خبرسازی جعلی منافقین علیه تیم مذاکره‌کننده هسته‌ای/ تخریب عضو اصلی هیات مذاکره کننده ایران با چه هدفی صورت می‌گیرد؟

خط تخریب مذاکرات از تهران تا واشنگتن

تحول مهم در جنوب سوریه؛ اعلام انحلال لشکر هشتم

انتقاد نماینده ملایر از پیامک های نیروی انتظامی برای کشف حجاب/ با طیب نیا برای وزارت اقتصاد رایزنی کرده‌اند، شاید هم گزینه جدی‌شان باشد