اوایل این هفته، شرکت OpenAI از دو مدل هوش مصنوعی جدید به نامهای o3 و o4-mini رونمایی کرد که بهطور خاص برای درک، تحلیل و تغییر تصاویر آموزش دیدهاند. این مدلها توانایی «فکر کردن روی تصویر» دارند، عبارتی که شاید تا دیروز بیشتر به قلمرو تخیل تعلق داشت. اما حالا با استفاده از همین توانایی، موج تازهای از روندهای همهگیر و گاه نگرانکننده در حال شکلگیری است.
از تفریح تا تهدید: وقتی هوش مصنوعی مکان را لو میدهد
یکی از سرگرمیهای جدید کاربران حرفهای، استفاده از این مدلها برای شناسایی موقعیت جغرافیایی عکسهاست؛ کاری که به آن ژئولوکیشن (Geolocation) گفته میشود. کافیست عکسی را به مدل بدهید، حتی اگر عکس دارای موانعی مثل آدمها یا تاریکی باشد، مدل با برش (Crop)، زوم، و تحلیل تصویر، بهطور مستقل تلاش میکند تا نام مکان و مختصات دقیق جغرافیایی را مشخص کند.
در بسیاری از موارد، مدل پیشرفتهتر o3 توانسته این کار را با دقت خیرهکننده انجام دهد. حتی اگر در ابتدا اشتباه کند، تصویر را قطعهقطعه کرده و بهصورت پیگیرانه تلاش میکند تا مکان درست را پیدا کند.
پژوهشهای دانشگاهی و شگفتی کاربران
برخی اساتید دانشگاهی مانند «ایتن مالیک» (Ethan Mollick) تأیید کردهاند که این مدلها از اطلاعات ژئوتگشده (Geotagged) عکسها استفاده نمیکنند، بلکه صرفاً با توانایی تحلیلی خود این کار را انجام میدهند. این نکته قدرت و در عین حال نگرانیبرانگیز بودن این ابزار را نشان میدهد.
حتی کاربرانی که فقط یک عکس ساده بارگذاری میکنند، بدون نیاز به دادههای اضافی یا اطلاعات زمینهای، میتوانند با کمک این مدلها، مکان ثبت عکس را کشف کنند. این ویژگی جذاب، اما در عین حال ترسناک است. چرا که ابزار قدرتمندی که زمانی در اختیار کارشناسان خاص بود، حالا در دسترس همگان قرار گرفته است.
لبه تاریک ماجرا: تهدیدی علیه حریم خصوصی
اگرچه این قابلیت میتواند برای اهداف پژوهشی، هنری یا سرگرمی جذاب باشد، اما مرز بین تفریح و نقض حریم خصوصی بهشدت باریک شده است. در نبود محدودیتهای لازم، فردی میتواند با یک عکس ساده، محل زندگی یا کار شخص دیگری را شناسایی کند. مسیر از مزاحمت اینترنتی تا تعقیب فیزیکی در دنیای واقعی، شاید فقط چند دقیقه طول بکشد.
این دستاورد شگفتانگیز در دنیای هوش مصنوعی، نیازمند کنترل، سیاستگذاری و آگاهسازی فوری است. امید میرود شرکتهای توسعهدهنده، مانند OpenAI، با شفافیت و مسئولیتپذیری در برابر تهدیدهای احتمالی این فناوری نوظهور بایستند و از سوءاستفادههای احتمالی پیشگیری کنند.
حدسهای خوب و حتی بهتر از انسان ولی نه معجزهآسا!
برای آزمایش من عکسی از هلسینکی و عکسی از خیابان ناصرخسرو را به ChatGPT دادم. میشد حدس زد که اجزای عکس اول هوش مصنوعی را به نتیجه برساند، اما عکس دوم میتواند گیجکننده باشد.
همین طور هم شد. هوش مصنوعی با دقت محل عکس را شناسایی کرد. اما در مورد دوم گرچه حدس زد از بافتی قدیمی یا شهری قدیمی در ایران باشد. اما حدسش درست نبود.
به نظر میرسد این تصویر نمایی از خط ساحلی هلسینکی (Helsinki) در فنلاند باشد؛ ردیف ساختمانهای رنگارنگ به سبک نئو‑رنسانس کنار آب و کشتی بادبانی سهدَکل پهلوگرفته، شبیه اسکله جنوبی شهر و محدوده اولهآنلینا/ایراست که رو به خلیج اسکلد دریا باز میشود.
احتمال میدهم این تصویر از «خیابان سِپَه» در شهر قزوین باشد؛ خیابانی تاریخی که بهخاطر جوی آبِ مرکزی و پیادهراه دوطرفهاش شناخته میشود و در سالهای اخیر سنگفرش و بازآرایی شده است. البته عکسهای خیابانهای دیگری مثل چهارباغِ اصفهان یا تربیتِ تبریز هم شباهتهایی دارند، پس ممکن است اشتباه کرده باشم؛ اما ترکیب جوی، درختان صفکشیده و وجود مسیر خودرو در یک طرف، بیش از همه با سپه قزوین همخوانی دارد.
پاسخ درست: خیابان ناصر خسرو تهران
source