关键点提炼
- 2012 年他离开 Google 科学家的职位回国创业,立志「用 AI+语音重新定义人机交互」开始算,到现在因为 AIGC 业务,终于走向业务繁盛,并跨入大模型时代,2024 月 24 日,李志飞创办的出门问问港股上市,成了国内 AIGC 第一股,经历了整整 12 年。
- 是在一个公司里,以 3、4 年为一个循环,在语音助手、智能硬件和 AIGC 上至少创了三次业。
- 产品历程
-
- 2012 年,李志飞那个简陋的 App 可以用听懂语音提问给出相应回答,对国内投资人来说确实是很酷、也很震撼的事情,这让投资人开始想象这件事最终对搜索等业务带来改变的可能。
- 2013 年初春节前后,出门问问发布了第一个产品,好像是一个叫火车达人的 App。当用户需要查询火车票时,只需要对着手机说「帮我查从北京到南京的火车」,就会出来结果。
-
-
- 所以很快就有了不小的下载量,但问题来了,很多用户只用一下就再也想不起来打开。
- 留存差归因于「要下载和使用一个 App」这个门槛动作,于是开始基于微信公众号来做语音助手,甚至在短时间内,公众号拥有了 100 万用户,但留存依旧非常差。而且后台发现用户「嗯、啊」的无效 query(查询)非常多,显然大部分用户并不知道怎么用,用起来也比较费劲。
-
-
- 出门问问在 Google Glass 中内置了其语音助手,AR 眼镜这个产品特性确实极大提升语音交互的必要性
-
-
- 中国卖掉的 2000 副眼镜中,70% 的比例都是出门问问刷过机的
-
-
- 2014 年李志飞到深圳研究硬件产业的智能硬件的热度已经明显上升,开始做做智能手表
-
-
- 最主要的原因:手机触摸滑动的交互方式很难被语音交互取代,所以一定要是非手机的硬件,语音交互才可能真的重要。他已经琢磨过眼镜、车载、机器人,智能手表这四种硬件。
-
-
- 2014 年,出门问问先做智能手表的 ROM,2014 年 12 月份出门问问发布了中文智能手表操作系统 TicWear,2015 年 6 月,最终发布了智能手表 TicWatch。
-
-
- 公司也在后续几年从零收入变成了一年有几亿收入的公司,从一个 30-50 人的小创业团队变成了超过 200 人的成建制的科技公司。
- 迎来了一位重要的战略投资人——李志飞的老东家 Google,投资4000万美金;
-
-
-
-
- 只有两个问题有待回答,一个是 2012-2014 年在手机上的遗留问题——语音对这些可穿戴设备是不是用户最普遍的交互方式?
-
-
-
-
-
-
- PMF问题:「最终发现语音交互在智能手表上不重要,语音助手在智能手表上就是一个噱头,不要把这种技术噱头当做用户需求。如果今天回去再看,一定不能因为你自己对这个东西热爱,觉得这东西很酷,就觉得用户也是这么想的。」
-
-
-
-
-
-
- 智能手表最终是不是手机厂商的势力范围,可穿戴设备可以长成新的超级品类,进而满足李志飞「语音交互革命」的目标吗?
-
-
-
-
-
-
- 「如果再来一遍,就不应该选择巨头顺带干一干就比你要牛的品类,我就是在 2014 年的时候没有意识到手机巨头会变得很牛,智能手表就是这些巨头顺手可以干的。」
-
-
-
-
- 2014-2018,智能音箱、智能耳机、智能后视镜…越来越多的硬件开始立项和发布,关键是当时出门问问的团队能力正值鼎盛,真的是软件、硬件、算法三位一体,以 AI 为核心的软硬结合
- 2019 年 3 月,出门问问历史上第一次开始裁员 20%,转型方向是做软件。当时李志飞定了三个条件:软件、 SaaS 商业模式、核心要靠 AI 技术
- 2020 年初出门问问的年会上,李志飞第一次和团队讲「生成式 AI 是未来」。原因就是生成式的技术,第一相对成熟,第二它生成的东西用户可以感知。(转变:从用户的需求和商业模式去考虑)
-
-
- 本质上 TPF(技术产品匹配)和 PMF(产品市场匹配),其实对一个科技创新公司是同等重要的。
-
-
- 2021 年的时候,小产品叫魔音工坊,一天已经能有几万块的收入了,到 2022、2023 一天十几万,几十万,直到在他的上市招股书里,这个业务已经是他的主力收入之一,一年产生上亿收入。
- 2023 年 2 月,中国创业圈对 ChatGPT 和大模型的热情已经突破临界值,李志飞因为对这个领域研究早,洞察深,成为了各种创业组局和交流中的「香饽饽」
-
-
- 不去为了大模型融资,也不进入大模型公司的战场
- 他把自己的大模型作为一种产品引擎的能力去建设,选择让出门问问继续作为一个应用公司的定位,去走「产模一体」的路。
-
-
- 近两年来,魔音工坊等软件产品的成功、对大模型技术的迅速跟进,让出门问问完成了技术和商业模式迭代,也成了 AI 产品落地和大模型应用领域的头部公司
- 李志飞很多特立独行的判断,虽然他说错过不少,但也说中了很多;关键是他敢于在「非共识」上知行合一的真干,12 年来他能这么命硬,归根结底还是来自于「非共识」下的有技术和能创新。
- 出门问问真正的优势,是完成了技术和商业上的跨越时代。它的技术架构、组织形态、商业模式、还有 CEO 个人的 Mindset,都已经和上一个轮回完全不同
- 语音产品总结
-
- 在出门问问最黄金的年代,一次次用一个个的产品去撞击「南墙」,但是「南墙」为什么在这里,为什么拆不掉,团队一直缺乏真正深入的探讨。
- 现在看来,首先交互需要有非常确定的结果。但是语音交互这件事的 Pipeline(环节流程)太长了,影响语音交互结果的环节太多。硬件上的的麦克风、网络连接,AI 侧的唤醒、语音识别、自然语言对话,然后找答案,这里边每一个地方都会有 5% 以上的概率出问题,所以端到端基本上就是很难稳定的实现。
- 交互是一个非常高频的东西,对用户需要尽量的「低功耗」,比如肌肉记忆是低功耗的,它不需要做实时运算,语言却是人脑最复杂的实时运算任务之一,以至于全天下 99% 的人,实时语言能力都很差。所以滑动、触摸这些动作,它确定性高又足够简单,无法被替代。
- 创业要素总结
-
- 科技的「酷」是最大的陷阱,只有真需求才是真力量;
- 创业的「难」是最大的借口,只有真目标才能逼出好业务;
- 不断敢于「非共识」是创业者的核心气质,但多快好省的验证和放弃,也是创业者的核心能力。
AI Gump评论
- 这个赛道有很多类似的经历,技术驱动赋能产品(实际可能会演变成 拿着锤子找钉子)、软硬件一体化(整合上游供应链、产品定义设计、下游品牌渠道、巨头干仗)、语音交互作为产品的一个要素的核心价值
- 作为创业者,或者创业公司,需要是综合的能力,技术敏感度、产品设计、商业经营操盘,应对市场变化、资本投资环境变化、社会疫情变化,作为一号位,完善多维度的Mindset建设能力,没有明显致命短板;
- AI这个赛道多半是技术要素很重,正是这种使命感、领域内的专研和非共识的趋势预判,从【语音带来下一代人机交互】技术视角使命,转变成场景应用+技术双轮驱动,产模一体。