新型 AI 挑戰:從照片中預測位置的驚人現象

OpenAI 最新推出的推理模型 o3 能夠分析照片,特別擅長根據圖像線索進行地理定位。數字照片的元數據通常包含從拍攝相機的技術信息到基於 GPS 數據的拍攝地點等各種信息,而 ChatGPT 則不需要這些細節。

這款最新的 GPT-o3 模型在地理定位幾乎任何提供的照片方面表現出色。最近,一種新的 AI 挑戰在網絡上迅速流行,許多人將去除所有元數據的圖像上傳至運行高級推理模型 o3 的 ChatGPT Plus,並請求它進行「地理猜測」。

這個模型的特點在於其推理過程,能夠顯示思考的時間、如何分解圖像以調查特定部分,並解釋其推理過程及解決地理定位謎題的成功程度。

在進行幾次實驗時,首先選擇了一張來自文章的 Praia de Santa Monica 海灘的圖片。在這次測試中,發現自己犯了一個關鍵錯誤,給 ChatGPT 提供了過多線索。下載了這張圖片後,將其放入 ChatGPT,並使用了「GeoGuessr」這一提示,這也是一個流行的在線地理猜測遊戲的名稱。

僅過了 24 秒,ChatGPT 就給出了回應:
可能的地點:佛得角的博阿維斯塔,具體是 Praia de Santa Mónica。
為何這個海灘符合:
水色與清澈度:淺藍到深藍的漸變在中大西洋熱帶島嶼中很常見,火山棚迅速下降。
沙子的顏色:沙子是淺金色且顆粒非常細,與博阿維斯塔的沙漠和沙丘海灘相符,而不是加勒比海的白色珊瑚沙。
波浪與坡度:浪潮穩定且適中,典型的亞特蘭大波浪衝擊長而淺的海床;地中海海灘很少出現這種持續的白浪。
天空與地平線:淡淡的霧氣覆蓋著淺灰藍色的天空,與有時從非洲漂流到佛得角群島的哈馬坦塵埃一致。
信心程度:低至中等。許多開放的沙丘海灘——從加那利群島到西撒哈拉的某些地區,甚至某些加勒比海岸——在沒有地標的情況下可能看起來幾乎相同。

這個結果相當準確。然而,隨後發現圖片文件名中包含了一些位置信息。於是,決定給 ChatGPT o3 一個更具挑戰性的任務,這次不下載圖片,而是截圖並粘貼到提示欄中。這樣可以去除所有元數據,迫使模型僅根據圖像進行地理定位。

選擇了一張書店的圖片,甚至不確定其具體位置。ChatGPT 開始檢查潛在的書店,並放大了許多被視為線索的圖像細節,例如波斯地毯,以及一些書籍和標誌。模型在思考時考慮了紐約市及世界各地的多家書店。

這個過程持續了幾分鐘,最終未能給出答案。隨著時間推移,ChatGPT o3 在多次失敗後也出現了伺服器錯誤。最終,成功運行後,先後上傳了一張自拍照和同一張未經處理的照片。

對於前者,ChatGPT 將我的位置分解為中城曼哈頓,這基本正確,但未能確定具體位置,並承認其「信心程度」較低。當關閉虛化效果後,再次上傳截圖,僅用 56 秒便找到了我的確切位置:
最可能的位置:中城曼哈頓,位於公園大道以東的 42 街南側,Cipriani 42nd Street 旁邊(110 E. 42nd St.)。估算坐標:40.7518 N, 73.9775 W。
線索分析:
綠色八角形標誌和黃色字體的旗幟均顯示「Cipriani」,這是現今位於 Bowery Savings Bank 建築的 Cipriani 42nd Street 的確切街面。
對面是 120 Park Ave. 的金色外立面,其斜面玻璃亭在左肩後方可見,這是該地址的獨特特徵。
相機朝西拍攝,中城的退縮塔樓、六大道的巴士站標誌和 One Vanderbilt 的一角都與此視線對齊。
左下角的綠色 Evergreen 運輸集裝箱用作施工屏障,與照片相符。

信心程度:中等。Cipriani 的品牌和獨特的 120 Park Ave. 外立面提供了高質量的參考點,儘管在 42 街的更西側也存在類似的外立面。

當上傳一張在安提瓜拍攝的照片時,這是一張透過圍欄拍攝的山坡圖像,ChatGPT 正確猜測出這是一個靠近加勒比海的熱帶島嶼,但無法確定具體位置。在最後一次測試中,則給了它一張更清晰的度假村照片。ChatGPT o3 思考了 2 分 22 秒後,認為是安提瓜的 Hawksbill Bay。雖然島嶼正確,但我所住的 Long Bay 度假村位於島的另一側,距離 46 英里。

這是一個有趣的 AI 遊戲,適合與朋友一起玩,但也存在一些令人擔憂的隱私問題。如果將自己或任何地點的數字照片上傳至網絡,任何擁有 ChatGPT Plus 訪問權限的人都可以利用 o3 模型來推測您的位置或曾經的位置。這不僅僅是朋友和家人需要擔心的問題,甚至雇主或當局也可能對您的位置感興趣。

同場加映:香港無痛,不用 VPN 情況下使用 ChatGPT

【教學】免費使用 ChatGPT-4 的 6 個方法 /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。