پیام ویژه

آخرين مطالب

ChatGPT حالا می‌تواند موقعیت مکانی عکس‌ها را با دقتی شگفت‌انگیز شناسایی کند خواندنی ها

ChatGPT حالا می‌تواند موقعیت مکانی عکس‌ها را با دقتی شگفت‌انگیز شناسایی کند
  بزرگنمايي:

پیام ویژه - دیجیاتو / OpenAI تأکید می‌کند این فناوری می‌تواند در حوزه‌هایی مثل دسترسی‌پذیری، تحقیقات علمی یا پاسخ به موقعیت‌های اضطراری مفید باشد.
مدل‌های جدید OpenAI که به‌تازگی منتشر شده‌اند، می‌توانند با استفاده از سرنخ‌های موجود در تصاویر موقعیت مکانی عکس‌ها را تشخیص دهند؛ قابلیتی از ChatGPT که OpenAI آن را «پیشرفتی چشمگیر در ادراک بصری» می‌نامد.
حدس موقعیت عکس با تفکر و استدلال
براساس گزارش PCMag، کاربران تصاویر خود را بارگذاری می‌کنند و از ChatGPT می‌خواهند محل ثبت آنها را حدس بزند؛ فرایندی که از آن با عنوان «جستجوی معکوس موقعیت» یاد می‌شود. نتایج این تست‌ها به طرز شگفت‌انگیزی دقیق بوده است. هوش مصنوعی عکس را تجزیه‌وتحلیل کرده و پس از چند ثانیه «تفکر» با ارائه پاسخی همراه «زنجیره‌ای طولانی از استدلال داخلی» توضیح می‌دهد چگونه به نتیجه رسیده است.
در یکی از نمونه‌ها، کاربری با نام «Yumi» در شبکه اجتماعی ایکس، تصویری از کتابی در کتابخانه منتشر کرد و مدل فقط براساس کدی که روی برچسب کتاب درج شده بود، به‌درستی حدس زد که تصویر در دانشگاه ملبورن گرفته شده است.

پیام ویژه


بازار


در نمونه‌ای دیگر، کاربر عکسی عادی از خانه‌ای در سورینام بارگذاری کرد که احتمالاً از گوگل‌ارث گرفته شده بود و ChatGPT توانست آن را به‌درستی تشخیص دهد.
ابزارهای مکان‌یابی عکس با هوش مصنوعی پیش از این نیز وجود داشتند اما با استفاده کاربران عادی ازمدل جدید o3 شرکت OpenAI این قابلیت فراگیر شده است. البته مدل قبلی، GPT-4o، نیز از چنین قابلیتی برخوردار است اما دقت آن پایین‌تر از مدل o3 است.
مقایسه عملکرد مدل‌ها در حدس موقعیت تصویر
در تستی که خبرنگاران گرفتند، هر 2 مدل باید محل ثبت تصویری از خودروی الکتریکی جدید سوبارو را که در نمایشگاه خودروی نیویورک معرفی شده بود، حدس می‌زدند. مدل GPT-4o نتوانست محل دقیق را مشخص کند اما به‌درستی تشخیص داد تصویر احتمالاً در یکی از نمایشگاه‌های خودرو در شیکاگو، نیویورک یا لس‌آنجلس گرفته شده است. این نتیجه‌گیری براساس عواملی مانند محیط نمایشگاهی، خودروهای متعدد، تابلوهای اطلاع‌رسانی و حضور بازدیدکنندگان انجام شد. البته نام خودرو را اشتباه خواند و آن را «Trailspeed» نامید، درحالی‌که نام صحیح آن «Trailseeker» بود.


پاسخی که مدل GPT-4o برای حدس موقعیت تصویر به خبرنگاران داده است.
در مقابل، مدل جدید o3 پاسخ دقیق‌تری داد. این مدل پس از «یک دقیقه و 40 ثانیه تفکر» اعلام کرد: «کراس‌اوور آبی خودروی الکتریکی جدید سوبارو با نام Trailseeker مدل 2026 است که نخستین بار در نمایشگاه بین‌المللی خودروی نیویورک 2025 (NYIAS) در مرکز همایش‌های جیکوب جاویتس منهتن معرفی شده است.» این مدل با بررسی صفحه معرفی خودرو در وب‌سایت سوبارو و تطبیق طراحی غرفه با عکس بارگذاری‌شده، توانست مطمئن شود مکان موردنظر صحیح است.

پیام ویژه

پاسخی که مدل o3 برای حدس موقعیت تصویر به خبرنگاران داده است.
ChatGPT همچنین می‌تواند ترکیبی از تشخیص تصویر و ویرایش آن را انجام دهد. اگر کاربری تصویری ناقص یا بی‌کیفیت بارگذاری کند، مدل می‌تواند عناصر موجود در تصویر را جابه‌جا کند تا به سؤال کاربر پاسخ دهد؛ برای مثال، در تصویری با نوشته‌ای ناخوانا و وارونه، ChatGPT توضیح می‌دهد که ابتدا تصویر را می‌چرخاند تا قابل خواندن شود سپس متن نوشته را تحلیل می‌کند. نتیجه این فرایند: «4 فوریه – پایان نقشه راه» بود.

پیام ویژه


این قابلیت هوش مصنوعی نگرانی درباره حریم خصوصی را افزایش می‌دهد
اپلیکیشن‌های دیگری همچون «Geospy» نیز از هوش مصنوعی برای تشخیص موقعیت مکانی براساس سرنخ‌هایی مانند نوع پوشش گیاهی یا معماری استفاده می‌کنند اما استفاده از این ابزارها نگرانی‌هایی درباره حریم خصوصی ایجاد کرده است. گزارش «404 Media» ابتدای سال نشان داد ممکن است نیروهای امنیتی یا حتی افراد سودجو از چنین ابزارهایی برای مکان‌یابی افراد از طریق عکس‌های منتشرشده در شبکه‌های اجتماعی استفاده کنند.
بااین‌حال OpenAI تأکید می‌کند که فناوری جدید می‌تواند در حوزه‌هایی مانند دسترسی‌پذیری، تحقیقات علمی یا پاسخ به موقعیت‌های اضطراری مفید باشد. سخنگوی این شرکت می‌گوید:
«مدل‌ها را طوری آموزش داده‌ایم که از ارائه اطلاعات خصوصی یا حساس خودداری کنند. ابزارهای ایمنی لازم را برای جلوگیری از شناسایی افراد در تصاویر افزوده‌ایم و بر استفاده کاربران را فعالانه نظارت و درصورت سوءاستفاده مطابق با سیاست‌های حریم خصوصی خود برخورد می‌کنیم.»

لینک کوتاه:
https://www.payamevijeh.ir/Fa/News/1582674/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

داماد به خاطر مادرزنش قاتل شد

افزایش بین 5 تا 7 میلیونی حقوق بازنشستگان لشکری

لنوو تینک‌پلاس معرفی شد؛ پاوربانک 140 واتی، بدنه شفاف و قیمت 39 دلار

انتصاب مدیرکل حوزه ریاست بنیاد شهید و امور ایثارگران

«فارس» در صدر مصدومان ترافیکی نوروز امسال

هشدار دانشمندان نسبت به عملکرد سی‌تی‌اسکن‌ها در بدن

اعلام زمان برگزاری آزمون نهایی یازدهمی‌ها و دوازدهمی‌ها

آیین بیل‌گردانی مردم «نیم‌ور» با قدمتی 2 هزار ساله

جزئیات افزایش ضریب حقوق کارمندان دولت در 1404

هزینه 25 میلیارد دلاری برای رفع ناترازی انرژی

درگیری پلیس اسرائیل با معترضان صهیونیست

سرمقاله دنیای اقتصاد/ راه دشوار مذاکره

توقیف بیش از 4 هزار خودروی متخلف در تهران

ویدئویی از سرقت وحشیانه موبایل از یک خانم

بازی Escape from Tarkov پس از 8 سال دسترسی زودهنگام، امسال عرضه خواهد شد

سرمقاله خراسان/ رابطه قاچاق و افزایش قیمت دلار!

افراد مسلح در نیجریه 56 تن را کشتند

وزیر تعاون: دولت باید از بنگاه‌داری خارج شود

تظاهرات گسترده علیه ترامپ در ایالت‌های آمریکا

هشدار نسبت به فروش داروهای یخچالی در ویترین فضای مجازی

جو آرام و افزایش دما در اکثر مناطق کشور

نرخ جدید کرایه‌های مترو، اتوبوس و تاکسی از فردا اعمال می‌شود

یک بام و دو هوای مسئولان در تامین برق چاه‌های آب کشاورزی

سی‌ان‌ان: ترامپ دوباره ویتکاف را به مسکو می‌فرستد

آمریکا طی سه ساعت 38 بار به یمن حمله کرد

حمله هوایی آمریکا به یمن

ادامه اعتراضات در ترکیه

کشف 80 میلیارد ریال طلای قاچاق توسط پلیس راه آهن

روزنامه جوان: شلیک مستقیم به اوباش و اشرار، خواسته مردم است

مسیر ناهموار جهش تجارت

هواوی تراشه هوش مصنوعی Ascend 920 را با وعده عملکردی هم‌سطح با انویدیا H20 معرفی کرد

معمای ولادیمیر

روحش را به دست گرفت؛ درباره فاطمه، عکاسی که در بمباران اسرائیل شهید شد

آیا نتانیاهو بازنده مذاکرات ایران و آمریکا خواهد بود؟

رقابت ربات‌ با انسان‌ در دوی ماراتن را تماشا کنید

استراتژی چندوجهی و مذاکره ایران و امریکا

عکس سال 2025؛ مامان حالا می‌توانم اشک‌هایم را پاک کنم؟

زیدآبادی نوشت: کلاه گشادی تحت نام عدالت‌خواهی

در مسیری پرپیچ و خم؛ چشم انداز مذاکره با آمریکا

واکنش اتحادیه اروپا به آتش‌بس 30 ساعته روسیه با اوکراین: جنگ تمام شود

گزینه پیشنهادی دولت برای وزارت اقتصاد مشخص شد؟

دست دوستی سعودی

طراحی آیفون 17 پرو با دوربین یکپارچه لو رفت

اداره بهره‌وری DOGE در حال ساخت دیتابیس عظیمی از اطلاعات حساس شهروندان است

سایه روشن روابط

جاده‌‌کشی در قلب زیستگاه پلنگ و خرس

حریق در قطار مسافربری؛ قطار حادثه دیده به مسیر خود ادامه داد

کشف جسد مرد 30 ساله در کانال آب

پیش بینی قیمت طلا و سکه 31 فروردین 1404

ویدئو مفهومی آیفون 17 پرو مکس طراحی و ویژگی‌های این گوشی را نشان می‌دهد