有点恐怖。
现在,AI只需随意一张照片,就能知道你在哪里,而且是可以精确到经纬度的那种!
例如下面这张随便到不能再随便的自拍,你能猜到小姐姐在哪里吗?
这事交给现在的AI来处理,它只需要“看”一眼,就能把照片里的**“底裤都给扒出来”**:
美国,加利福尼亚州,旧金山机场洗手间,93号登机口附近……
坐标:37.6189° N,122.3744° W
再如下面这张照片,AI根据湖的特征、树木和背景中的山脉,就匹配到了玛丽湖,同样是给出了精准的坐标:
恐怖如斯,恐怖如斯。
至于这个AI工具,则是最近由一位俄罗斯黑客所推出,名叫GeoSpy,号称是可以根据照片里的各种细节做分析来判断地理位置。
包括光线、植物、建筑风格、天气,并将它们与大量街景/地理照片进行对比,据说也用到了地理空间视觉大语言模型的技术。
而GeoSpy的功能,像极了此前一款基于谷歌地图的游戏GeoGuessr——
游戏中会展示一张街景图,然后玩家要从地图上找到它的坐标位置;给出答案与正确坐标越近,分数越高。
之前也有一位国外小哥(ID:georainbolt)凭借只需看0.1秒街景,就能在世界地图上快速锁定位置而在网络上蹿红。
果不其然,斯坦福计算机系学生Andrew Gao在尝试了GeoSpy之后,就开始喊话这位小哥了:
你要失业喽~
不过也有GeoGuessr的职业玩家坐不住了,站出来表示不服:
申请一战!
人类 vs AI
这位挑战者,名叫做Gavin(下文我们简称“G哥”),是一位正在参与GeoGuessr 2024世界杯的职业选手。
G哥把他跟AI在线对垒的情况上传到了网上。
规则和GeoGuessr一致,还是看图猜位置。
在第一轮对决中,G哥凭借抓到了马路道边上土耳其样式柱子的细节,判断这张图可能是在土耳其附近。
结果显示,这张图里的位置确实是在土耳其附近,但距离精准的位置还差241km。
接下来就轮到GeoSpy这个AI选手登场了。
G哥处理的方式是将截图“投喂”给AI,在静候了片刻之后,GeoSpy就给出了结果。
国家:土耳其
经纬度:39.998923, 32.607491
然后G哥在地图中搜索这个经纬度,再跟GeoGuessr的“标准答案”做比较:
第一轮的结果可以说是让G哥大受震惊,GeoSpy给出的位置比他的更近……来看下G哥当时的表情:
在接下来的“火拼”中,G哥变得更加仔细,都凑近屏幕去捕捉细节了。
G哥这次给出的答案是苏门答腊岛,但实际的结果却不是很理想,距离“标准答案”足足703km。
到了GeoSpy这边,虽然大致位置都是在印度尼西亚,但这次给出的位置就没有那么准确了。
不过比起G哥给出的答案,距离上却还是AI的答案更近些,这使得G哥开始有点无语子……
在接下来的比试中,即便G哥把猜测距离压缩了86km,但GeoSpy给出的结果又是更接近于“标准答案”。
G哥此时已经开始掩面了:
在最后一轮battle中,G哥直接说出:
人类必须反将AI一军。
然后G哥把头埋得更深了,当他捕捉到图中路边有文字时,脸上露出了得意的笑容:
这局稳了,AI它不识字的。
G哥的结果是,距离标准答案134km。
不过令G哥万万没想到的是,GeoSpy,它!识!字!
这张照片是在波兰拍摄的,因为建筑物上写着“Abet”,这是一家波兰公司。
然而G哥还是觉得这把有希望,因为他发现GeoSpy只能定位到城市。
所以这把如果AI给出的坐标是“标准答案”旁边的城市“华沙”,那么G哥就赢了。
结果还真是……G哥也是露出了久违的笑容,并骄傲地说:
AI永远不会打败人类!
G哥在下一轮的比拼中,将地图范围缩小到了自己的老家——芝加哥。
这次在自己的地盘上,G哥的表现非常勇猛,有距离“标准答案”仅2m和4m的成绩。
不过AI这边也是非常精准,起码在看图描述的过程中可以精确地说出周边的地址,这也让G哥着实捏了一把汗。
但在地图上搜AI给出的坐标的时候,却比文字描述的地点远一些了,有的甚至还定位到了海上。
……
最后,G哥在与AI交锋了数次之后感慨道:
这次体验非常有趣并且让人印象深刻。
但我也害怕这样的技术在未来5年后会迭代到什么样的程度。
也会频频翻车
其实在刚才G哥体验的过程,我们就能发现GeoSpy也存在一定的bug。
例如它更倾向于把地点定位到某个城市,以及给出的经纬度坐标会跟文字描述的地点有偏差。
网友们在实际体验过后也有类似的感觉。
以至于许多人开始怀疑这个GeoSpy到底是不是凭借所谓的“地理空间视觉大语言模型”技术。
毕竟现在每张照片的背后就会有大量且丰富的信息:
但无论如何,这件事情倒是给我们敲了一个警钟——
技术的发展虽然日新月异,但我们也要时刻警惕数据安全的问题;平常一定要注意,不然一不小心就可能被开盒
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。