پیام ویژه
ChatGPT برای ایجاد تصاویر یک آپدیت مهم دریافت کرد
چهارشنبه 6 فروردين 1404 - 12:42:56
پیام ویژه - دیجی کالا / شرکت OpenAI به‌تازگی قابلیت تازه‌ای به نام «Images in ChatGPT» را به چت‌بات هوش مصنوعی خود اضافه کرده که با بهره‌گیری از مدل GPT-4o امکان خلق تصاویر را فراهم می‌کند. این ابزار جدید کیفیت رنگ‌ها را در تصاویر بالا می‌برد و نمایش متن درون آن‌ها را به شکلی چشمگیر بهبود می‌دهد.
به گفته‌ی تارا کریستینسن، سخنگوی OpenAI، این ویژگی از امروز برای همه‌ی کاربران در دسترس قرار گرفته است. او توضیح داد که افرادی که از نسخه‌ی معمولی ChatGPT استفاده می‌کنند، با وجود برخی محدودیت‌ها، می‌توانند بدون سقف مشخصی درخواست تولید تصویر داشته باشند. البته این احتمال وجود دارد که با افزایش استقبال کاربران یا تغییر نیازها، این محدودیت‌ها در آینده دستخوش تغییر شوند.
گابریل گو، مدیر گروه تحقیقاتی OpenAI، گفته که مدل «GPT-4o omnimodal» در توسعه‌ی این ابزار به کار رفته است؛ مدلی که توانایی پردازش داده‌های گوناگون را به‌خوبی داراست. گو همچنین به پیشرفت قابل‌توجه ویژگی «Binding» اشاره کرد و افزود: «در مدل‌های پیشین، حفظ هماهنگی میان بخش‌های مختلف تصویر چالش‌برانگیز بود، به‌ویژه وقتی تعداد عناصر تصویر افزایش می‌یافت.» برای نمونه، گاهی هوش مصنوعی به‌اشتباه به جای یک ستاره‌ی آبی و یک مثلث قرمز، یک ستاره‌ی قرمز و یک مثلث آبی تولید می‌کرد.
بازار



با این حال، مدل جدید این ناهماهنگی را برطرف کرده و حالا قادر است بین 15 تا 20 عنصر را با دقت در تصویر جای دهد. این در حالی است که مدل‌های قدیمی‌تر تنها می‌توانستند 5 تا 8 عنصر را بدون خطا مدیریت کنند. گابریل گو در ادامه توضیح داد که این قابلیت از روش «Autoregressive» بهره می‌برد؛ به این معنا که ChatGPT تصاویر را گام‌به‌گام، از بالا به پایین و از چپ به راست، خلق می‌کند. این رویکرد با روش مدل‌های پیشین مانند DALL·E که بر پایه‌ی «Diffusion model» کل تصویر را یکجا پردازش می‌کردند، تفاوت دارد و به همین دلیل تصاویر هماهنگی بیشتری دارند.
به گفته‌ی مدیر تیم تحقیقاتی OpenAI، این ویژگی نتیجه‌ی تلاش‌های مستمر و آزمایش‌های متعدد تیم او در ماه‌های گذشته به شمار می‌رود. او خاطرنشان کرد که اگرچه این ابزار هنوز در نمایش متون ریز و کوچک درون تصاویر با چالش‌هایی روبه‌روست، اما در مجموع توانسته کیفیت متن و تصویر را به‌صورت هم‌زمان حفظ کند. این پیشرفت گامی مهم در ارتقای تجربه‌ی کاربران ChatGPT محسوب می‌شود و نشان‌دهنده‌ی تعهد OpenAI به بهبود مداوم محصولاتش است.
این قابلیت جدید نه‌تنها دقت و کیفیت را در تولید تصاویر افزایش داده، بلکه راه را برای کاربردهای متنوع‌تر این چت‌بات در حوزه‌ی تکنولوژی هموار کرده است. انتظار می‌رود با دریافت بازخوردهای کاربران، این ابزار در آینده حتی کارآمدتر شود و محدودیت‌های فعلی آن نیز به‌تدریج کاهش یابد.

http://www.Yazd-Online.ir/fa/News/1575613/ChatGPT-برای-ایجاد-تصاویر-یک-آپدیت-مهم-دریافت-کرد
بستن   چاپ