直播全文_前半年，我看到的“有趣的”AI 产品-CSDN博客

本文链接：https://blog.csdn.net/pA2elX78qaJTADH/article/details/140706809

前天晚上受邀，我做了一次直播对谈 in MacTalk视频号（池建强老师的墨问西东平台），主题是「聊聊前半年看到的有趣的 AI 产品」。

其中有很多产品案例，一直有观众在问，具体是哪个产品名称，今天汇总分享下（平时散落在每天的AI日报里）

暖场：2个有趣的AI产品视频

1、动态漫画（《猫女探索宇宙》，日本网友创作的40秒视频），我第一眼看到时，真的惊到了——

2、教师根据学生的梦想（想当军人、消防员、医生、球员、企业家等等），使用AI生成“未来的你”的照片，激励学生（1分47秒视频）

强烈推荐大家看下这个视频！每个孩子，看到照片前期待的眼神、看到照片后的那种开心、以及小伙伴们的欢呼……没有什么比这个更美好的了。

AI一定不仅是为了降本增效，AI还可以带来人心的力量、引领和启迪。

视频里，所有这一切，都是来源于那位“老师”对学生们的爱。这是源头。

问一：这半年 AI 相关的产品，已经逐步在爆发了，可以聊聊你看到了什么样的趋势吗？

我个人是感觉，有3个层面的趋势，咱们从外往内，一层层说——

1、表面趋势：脉冲式的小爆款AI产品，时不时出现。比如最开始的妙鸭相机、哄哄模拟器、决战拜年之巅，到近期的粘土特效、已故亲人的照片生成/合影等等

- 成功原因：“用户已知需求的映射、效果确实在线（80分）、加上AI噱头”三者叠加

- 不持久原因：需求点本身是低频或非刚需，噱头价值衰减（媒体逐步脱敏、觉得习惯了）

2、深层趋势：AI产品方法论相关的认知，开始形成部分共识（开始收敛了）

比如 1） 不能简单累加AI功能，必须把账算清楚（ROI跑正）

比如 2）《AI产品方法论之“由用户来完成AI产品设计的最后一公里”》

- 2019年8月14日、5年前，首发于“AI产品经理大本营”

- 2022年3月9日、2年前，发布于公众号hanniman，然后有产品负责人的AI同行，单独微信说——

- 最近，有越来越多的一线产品经理跟我说，印象最深的就是这个认知点（详见《直播精彩全文_「AI时代，如何不FOMO地高效获取AI行业信息」》）

这句话，具体什么意思呢？就是

- 目前的AI技术效果，只有70分完成度。

- 产品经理设计好产品体验后，其实最多只有90分，并没完。

- 用户拿到产品后，还需要完成“个性化”的设置过程，补齐最后的10分。

类比来说，我们买宠物，会先选择大的类别，比如狗或猫，然后选择“子品类”（边牧？柯基？拉布拉多？），最后选择“个体”，具体是这一窝小狗中的哪一只。

当把宠物带回家后，我们会给ta起个名字，并通过多次交互，让宠物逐步认识家中的各位成员——这些，都和AI的初始化是极为类似的。后续，还会逐渐教会它去熟悉家中环境，知道哪里能去/哪里不能去等。

“由用户来完成AI产品设计的最后一公里”，意思是用户自己攒一个“趁手”的工具。就是说，在使用AI产品过程中，由用户来定义最终的使用场景、逐渐将产品中的一些不明确/清晰的体验特性feature/数据给明确掉、并逐渐调整自己的预期。

举例的话，曾经有篇文章，提到有个“国际AI即兴剧团”，在这个剧团里，人和AI一起工作，在表演中，AI不停抛出可能需要的提示和台词，供演出者参考。也就是说，并不是由AI来直接设计台词，而是抛出无穷无尽的创意和联想、辅助人类喜剧演员的演出，。

比如 3）AIGC的核心指标，不是节省了多少时间/人力（效率属性），而是提高了多少“转化率”（利润属性）。

- 详见《深度 | 关于AIGC商业化的13个非共识认知（8000字长文）》

3、底层趋势（问题）：LLM智能程度，陷入瓶颈期，但是不影响根据自己的想法、手搓AI产品，开始跑MVP

私下不少人感觉，GPT-5可能发不出来，进而导致6~18个月内，AI出现小低潮

问二：AI Agent 在前半年被提及的次数也比较多。你怎么理解 AI Agent，这块有看到什么样的好产品吗？

1、Agent是个筐，什么都可以往里面装……（之前叫AI助理、语音助手……）

2、记得有篇文章提到，Agent起源于拉丁语中的Agere，意思是“to do”。LLM语境下，Agent可理解为在某种能自主理解、规划决策、执行复杂任务的智能体。

按照这种定位来说，目前好像没有特别好、真正跨过那条“金线”的Agent产品。

3、因为目前还缺很多很多东西，比如

- 表层看，缺少：推理能力、记忆、使用工具等能力

- 深层看，还缺少机器和机器（Agent之间）通信和交互的底层架构和机制。比如7月21日的AI日报中，就介绍了《AI搜索新方向：第一个针对 AI Agent 构建的搜索引擎—— Exa AI》，里面提到一句话，叫做“人类不需要新搜索，但AI需要”。

这里还有一个，我个人原创的非共识认知，就是“未来AI企业，方向定位将不是按照To C/To B来划分，而是按照To 人/To AI 来划分”。详见《深度 | 关于AIGC商业化的13个非共识认知（8000字长文）》的第10点。

4、《AI Agent平台落地的真正瓶颈》中提到过，Agent这事，对参与者的认知要求太高。

内部的产品负责人，外部的共创人，两者都需要具备极深度的AI产品认知能力，才有“可能”去捅破这层窗户纸。

5、可能的突破口

1）短期：LLM+"RPA"，可能是短期落地的最佳姿势，“部分”实现生产力价值。详见《我的12个「2024 AI 猜想」》第1点。

RPA，即机器人流程自动化（Robotic Process Automation）

- 通过模拟鼠标、键盘、触屏等操作，自动完成人的各种软件操作动作。

- 也就是说，可以把我们日常的重复性动作，交给机器人来执行，节省时间。

（AI）只模拟感知能力，对劳动力的释放是极其有限的，经济效益价值也就极其有限（算不过账来）。所以可从虚实两方面入手

- 实：LLM+机器人（机械臂、自动驾驶、无人机）等能动的硬件载体。

- 虚：LLM+RPA

这里可以引出一个最近的产品案例，阿里最新推出的Mobile-Agent-V2：具有视觉感知功能的自主多模态移动设备代理。

这个官方解释太技术了。。意思是，能理解输入的一长句话，AI自己识别手机屏幕内各种元素和按钮，然后执行操作！视频非常值得一看——

2）长期：关于Agent：目前主流的“单体智能”思路有隐患，可能的突破口是“多体智能”

类似复杂系统/鸟群，单个智能体可能很简单（不一定要超过单个人类），但整体有非凡的智慧（AI Agent 团队 >人类团队）。

详见星球文章《开眼：复杂科学可能将暗中推动AI 2.0时代》（https://t.zsxq.com/118AIpLpk ）

问三：AI 搜索呢？我最近也在深度使用秘塔 AI 搜索。你感觉 AI 搜索会是一个怎么用的赛道？

1、秘塔搜索，我也觉得很好用。（当然，后来很多同类产品都在互相借鉴）其中一个典型场景，是生活百科类的问题。

- 因为常规文章，总会有所偏颇（有作者自己的动机诉求）或知识缺失，导致故意不说或不知道某些内容。

- 但AI搜索，能把一个问题各方面的优劣势都展示出来，看完后，我就知道该如何选择“适合自己”的方案了。

- 比如下面这个问题“穿袜子睡觉，到底好不好”？虽然前面那些好处道理，我都认可，但只一条“觉得不舒服”，那这个没办法，一票否决式的因素，那就不穿。（而有人有时喜欢穿袜子睡觉，也是ok的）

2、但是，毕竟目前还没有真正全民普及（还只是高知人群、AI/互联网从业者为主），说明有问题。

3、隐约感觉，目前AI搜索的产品形态，有问题

- 颠覆搜索的，大概率不是另一个搜索

- 背后原因，还是互联网搜索、手机上的触屏交互，已经能解决80%的头部高频需求场景了。用户习惯已经建立了，除非是——

4、未来可能的新机会

- 面向AI原住民（至少是“10后”）的新产品形态，比如虚拟人、语音交互等等

- 我更看重的是，还是前面提到的，机器和机器的交互（ To AI的搜索）。比如未来人不需要主动搜索，都是AI Agent主动来交互。

问四：a16z 把语音 AI 作为一个独立投资主题。你对 AI 语言方向的产品有做过研究吗？这个方向可能诞生哪些想象力的产品？

2012年夏天，我们就开始做AI语音助手，完整经历了AI 1.0时代的那一波产品探索，所以对这个方向，算是有些经验和认知积累的。

1、先说语言。

去年12月，我分享过一个重要的非共识认知：跨语言，可能是大模型最Native、现阶段最容易被感知和落地、但又最容易被忽视的能力。详见《深度 | AI领域10个非共识认知（8000字长文，90分钟直播回放）》

除了当时很火的郭德纲说英文、霉霉说中文的视频，我在社群里，还分享过很多这个角度的案例——

1）先说一个2B方面的，情况是这样，那些出海公司每到一个国家地区，就需要了解当地各种法律法规条文，有巨大的时间成本。那有家AI公司，就专门提供“快速将当地法律法规情况翻译、整理成母语”的服务。从产品视角看，非常清晰、讲得通。（详见 https://t.zsxq.com/WV7dw ）

2）2C方面，Spotify也推出AI语音翻译功能，“让你喜欢的播主用你的母语为你播报”——已经点出了本质：内容或IP价值是才是前提，不是任何一个小白都能把ROI跑正的。

3）我最想提的，还有AirChat（投资人纳瓦尔亲自参与的），一款所谓AI Native的社交产品。类似异步版的Clubhouse，用户创建私有或公开房间后，能用语音展开交流。

- 令人眼前一亮的是，基于LLM，用户发布语音之后，不仅可自动生成文本，并且还能根据用户选择的语言，模仿用户自己的音色，自动完成语音翻译。即，用户可以畅快地用母语和其他国家的人交流了！——这里面有很大的想想空间

- 这背后更底层的产品方法论认知是，我认为，AI的核定差异化增量价值，就应该是之前所谓的长尾、小众场景和群体！

4）另外还有：

- 日本地铁站使用“即时翻译屏幕”（https://t.zsxq.com/13XSklFTY )

- 自动翻译菜单APP（https://t.zsxq.com/13Bh381k1 ）

- 将（动漫）图片上的文字自动翻译工具（https://t.zsxq.com/13aAmOyYE ）

- 沉浸式网页阅读翻译工具（https://t.zsxq.com/134xcFXZN ）（背后认知：双语浏览，是最近一年非常落地的一个典型场景，虽然不太讨巧、媒体没那么激动）

- 将YouTube视频翻译配音成多种语言、并支持下载的工具（https://t.zsxq.com/134qIE9Pq ）

……

有这么多案例，其实会有很多、有意思的机会的。

2、再说语音。

用户习惯是很大瓶颈，这种代际改变，往往需要一个时代——“语音交互”能真正大范围落地，很可能还是需要等“AI原住民（至少10后）成年”。

问五：聊聊你看到的其他一些有趣的产品？

1、“外语学习+AI”方向，最近有不少有趣案例

1）马大哈翻译（刻意漏翻部分词）（详见4月27号的AI日报，https://t.zsxq.com/eLsfa ）

- 引导大脑猜测“中文里夹杂的英语单词”，好玩的同时会记住更多单词。

- 浏览中文网站时，会挑选一些词汇，转成英文单词，营造中夹英效果。

- 浏览英文网站时，把网站翻译成中文时，刻意略过一些字句（功能即将发布）。

2）自动翻译生词工具Relingo（详见7月20号的AI日报，https://t.zsxq.com/niu0T ）

- 最大的差异化功能是，可设置自己的词汇等级，就能“只”显示自己可能不懂的单词释义了（这样更方便学单词，而不是把整个句子都翻译完）

3）盘盘单词：用你的照片学英语

- 从（百度）网盘里检索图片，在图片上面打单词标签，给用户学习

- 不过出来的照片随机，而且加载时间漫长，应该允许自主选择上传图片

2：两个搞笑的案例视频，群众的智慧——

1）《小姐姐给异地男朋友买新衣服，这试穿方式可还行🤣》——AI试衣平替

2）《刘德华：我60多岁，还得哄你？》

问六：AI时代，如何不FOMO地高效获取AI行业信息？

如果只说一个认知——AI信息过载？应该担心的，并不是“知道晚了”，而是摄入了“半对半错”的信息。

什么意思？曾经看到有位大V讲AI的视频，时长15分钟。但是在评论区，有两个人说，这位大V“根本不懂AI”……为什么大家能够看得出来，他不懂AI呢？举个例子——

假设我说“我是一个篮球迷”，我非常喜欢芝加哥公牛队，我最崇拜乔丹、罗德曼多么厉害、库克奇三分很准、“禅师”菲尔杰克逊怎么怎么牛，balabala一堆？我说了很多。

Ok，那到这里，有没有什么问题？

问题在于，我要去证明，我是一个篮球迷，我说很喜欢公牛队、说了这么多人，但是我竟然漏了——我没有提二号人物皮蓬。如果我是一个真的球迷，怎么可能说了乔丹、罗德曼、库克奇、菲尔杰克逊，唯独没有提皮蓬？很有可能是，我并不是真的懂这个东西。

类比来说，回到前面的大V讲AI的视频。为什么我们发现他有问题？因为他说的内容，可能50%还可以，但另外50%有瑕疵。

一方面，他说的一些很大的行业概念，其实并没有那么好。比如“医疗+AI”，过去十年，IBM的Watson怎么样等等，业内的人都知道，是有很大的问题的。还有些领域，可能是面子工程，并没有真正的落地，但不懂的非业内人，就会拿来说事儿。

更重要的是，还有一些领域，他该说反而没说。这就有问题了。比如那个大V的视频里面，他没有提智能客服——过去的十年、五年、两年，智能客服，是已经明显的（部分）效果的一个领域，它已经在落地了，已经在融入我们生活了，已经在有一些公司能够养活自己了。如果是一个真的懂行的人，他不可能不提，因为这是真正有价值的一些具体领域（只不过说起来不够fancy、有噱头、带流量）。

所以说，这种半对半错的信息，才是更最可怕的。因为如果全错，你一看就知道了，也不会去受损害。而这种掺杂在一起的信息，无形之中摄入中毒了，你还不知道。

如何解决？最好信息源它本身，完整经历过一个周期、AI 1.0 周期。

经历过这种周期的优势，并不是他说的百分之百都是对的，而是说，他知道什么大概率是错的、是有问题的，因为当初很多的一些场景、需求点、feature，其实早一波的从业者，当初已经都想过、试过了。只不过现在大模型起来之后，又去做一遍，里面有一些坑，是可以跳过去、可以规避的。如果没有经历过的话，可能就不知道。

ps，以上详见《直播精彩全文_「AI时代，如何不FOMO地高效获取AI行业信息」》

串场：前面这么多有趣的AI产品案例，或者信息点或认知点，除了hanniman自己原创的之外，其实很多是散落在全网各个不同时期、不同媒体的不同文章里的，所以之前会好奇，是怎么能够发掘、记住这些信息的呢？

后来也是知道，其实是因为，你每天都会花2个小时，去精心出品一个AI日报，做了很多“笨功夫”，所以近期我们墨问便签，也是专门邀请hanniman来入驻，专栏名字叫做《黄钊的AI产品内参》——

问七：咱们这个专栏《黄钊的AI产品内参》，已经运营15个月了，大概形式和核心价值是什么？

好的，这个专栏的内容，之前在我们社群“AI产品经理大本营”内部，叫做「黄钊的AI日报」，其实已经“日更”运营了15个月，用户口碑反馈非常好（比如有很多一线的AI产品经理和互联网同行，是把它作为了自己的核心、甚至第一的AI信息源），所以我也才有底气，单独在墨问这边分享。