文章来源:体积比
1、产品里程碑
产品发布:
- 2022年8月 Perplexity AI 产品发布
- 2022年8月,支持GPT 3.5 Turbo fine-tuned 模型
- 2023年11月底,PPLX API
- 2024年1月,集成进入Arc浏览器
- 2023 年 3 月,支持 MIstral 模型介入
- 2024 年 4 月,Perplexity Enteripese 2B 版发布;IOS 版发布,支持语音交互
市场规模:
- 2022年 12月,累计访问量45M
- 2023年2月,月访问量10M,MAU 2M
- 2024年1月,MAU 10M
融资情况:
- 2022年8月成立Perplexity AI
- 2023年3月,A轮融资 $26M
- 2024年1月,B轮融资$73.6M,估值$520 M
2、产品体验:
主要功能
Answering engine 搜索生成答案
一句话总结: Perplexity AI 是一个 答案引擎(Answer Engine)
答案引擎用创始人印度小哥 Aravind 的话来说,答案引擎 = 搜索引擎(Search Engine) + 推理引擎(LLM Reasoning Engine)
产品布局上来看,由侧边栏和搜索框两个大的模块组成;搜索框占据主页面的80%,标题是简洁的 ”Where knowledge begins“,强调了产品知识获取的调性;搜索框下方给出了相关问题推荐,提供了一个快捷的体验路径给到尝鲜用户
我们尝试搜索 最近的热门话题 “Reddit IPO first day pop”,
生成的结果从上到下来看
- 用户 Query 作为标题
- 信息来源(通过标题卡片的方式进行罗列搜索来源);
- 生成的回答:LLM处理完的回答比较精简,风格和CHATGPT不太一样
- 相关的问题:罗列了三个与主Query相关的follow-up问题,通过点击“+”号可以直接生成;当问出第一个相关问题后,推荐的相关问题列表会更新,提升与最新的问题的相关度,形成一种 Thread 类似的问答体验
- 右侧根据问题和答案,返回了相关的图片和视频,包括生成与回答相关的图片
用户也可以从侧边栏快捷进入搜索栏
Focus中支持选择不同搜索的重点(包括 学术搜索、Youtube视频搜索、Reddit 帖子搜索、不搜索的选项);Attach支持上传文本、PDF、图片
Pro Search 对话式引导增强搜索
一句话总结: LLM 引导用户,提升用户 Query 的精准性,增强搜索找回的性能
开启 Pro 功能后,会对搜索 Query 进行引导和增强,对于不擅长提示词工程的用户比较友好,帮助用户逐步引导把一个比较模糊的问题进行更具象话的表达,逐步引导用户给出最精准的 Query
可以看到之类一共进行了两步的引导,完成了一个旅游计划中缺失的时间和兴趣点的部分,整体生成的回答 Pro 版本也比普通版本更详细
对于生成的问答,如果用户不满意的话还支持 Rewrite 功能,通过不同的 LLM 来完成对搜索结果的总结
Collection 收藏夹
一句话总结: 收藏夹,类知识库功能;对问答 Thread 进行整理、管理、分享
Perplexity AI 会收藏用户每个进行问答的 Thread,用户进入每个 Thread 的结果页,可以在上方点击 “+ Colletion” 把当前的对话整理到一个大的收藏夹中
创建Colletion后,整个收藏夹会以LIbrary的子项形式出现在侧边栏,点击进入收藏夹后,可以看到部分推荐的问题以及已经加入讨论的threads。该页面还支持多人共享,用户可以分享 Threads 和 Collection;
Collection 类似知识库的作用,用户可以把较为碎片化的多个问答围绕某一个主题进行整理和管理、分享
Discover 社区功能
一句话总结: 社区问答热搜,快速浏览最新的社区热点和其对应的 LLM 精选观点
进入Discover 频道,类似于微博热搜、头条新闻、Twitter Trending 这类的 Top新闻热点。不同的是,对比前面几类产品更去中心化的表达(进入微博热搜,可以看到多个用户的评论、看法),这里提供的是搜索整合完后的生成式的问答,可以理解为更类似于精选观点的概念
总结:
- 从产品体验上,对比传统搜索最大的不同是 Perplexity AI 基于 LLM 的能力理解用户的问题,并结合用户本地知识(PDF、文本、图片)和网页搜索结果来生成一个回答用户问题的报告,并提供相应的信息引用来源
- 生成的报告可以通过 Collection 收藏夹的形式进行归档,形成某个话题下的多份报告的形式,虽然目前功能除了归档外并没有打通 Collection 下同一类主题报告之间的关联
3、产品分析:
3.1、交互设计
围绕产品的核心功能入口 —— 搜索框,整体设计非常简洁,侧边栏支持折叠,提供了一个较为沉浸式的搜索体验,与 Knowledge 和生产力的主题结合起来,就像 Flomo的禅定功能,为了能让输入的时候不被其他内容所干扰,更加聚焦在新的提问的输入框
- 从侧边栏 New Thread 进入沉浸提问模式
- 折叠前 VS 折叠后
折叠和展开的图标分别在侧边栏的上方和底部。不熟悉的用户误点后较难回到默认的状态;整体交互设计很简洁,但在用户的引导上有部分缺失,例如在侧边栏 Library 下无法直观看到 Collection 和 Thread 的区别
Collection(左)VS Single Thread(右),需要悬浮鼠标才能看见
在回答生成页面,
- 严谨和可信: Sources 以卡片的形式放在了标题的下方,回答的上方。用户第一眼可以看到搜索后答案生成的引用,帮忙建立了下方生成答案的可信度;
- 多模态增强记忆:图片+视频+支持生成图片,多模态的方式让用户更容易对生成的答案产生联想,增强记忆
3.2、产品 AI 功能:
从整个链路上,几个重要的模块:搜索+重排+召回+推理+生成
这里的核心点在于每个模块组成的一个大系统中工程链路优化的问题,怎么样最小化每个链路的时延;模型层上,如何平衡外部的模型能力和训练对应每个模块所需要的模型,以及成本、体验、性能的之间的取舍问题
3.3、产品定位:
先来看一段通过 Perpelxity AI 生成的关于该产品的定位说明
Perplexity AI aims to transform the current search engine landscape dominated by keyword-based searches and links often buried under advertisements. Instead, it seeks to become an "answer engine" that directly provides users with concise, accurate answers backed up by a curated set of sources. This approach is powered by large language models (LLMs) and places the user, rather than advertisers, at the center of its operations. The goal is to revolutionize how people discover, access, and consume knowledge online, thereby transforming the structure of the internet as it is known today2.In essence, Perplexity AI aspires to embody the values of being scholarly, accurate, and truthful, aiming to raise the knowledge capital of the planet by making people smarter every day through a product that is more than just a means to make money.
可以看到 Perplexity 主要面对的用户是知识型工作者(Knowledge Workers)和大众用户,希望通过 AI 的能力改变用户在线上搜索、访问、消费知识的过程,改变由传统搜索引擎+信息流推荐引擎定义的目前互联网内容/知识的流量结构,帮助更多的人更高效学习,提升人均的知识资本(Knowledge Capital),从而提升用户的生产力
Perplexity 结合了搜索引擎和推理引擎的能力,是一款可对话式的答案生成引擎,对比传统搜索引擎:
- 可以理解用户的 Query 进行搜索,返回结果的相关性更好
- 对比传统搜索需要用户主动去查看结果,Perplexity 直接给出总结出的答案,节省了用户的时间
Perplexity AI 这个产品的核心点是什么?
创始人一句话总结,叫“Accurate facts at fatest time possible”
提到了两个点:
- 通过搜索召回 + LLM 推理生成的答案可靠性很高
相比于 ChatGPT 3.5 这种通过预训练数据生成答案的产品来说,增加了联网搜索功能,提升了信息的时效性和多引用来源的可靠性。
相比于 ChatGPT 4.0 版本, Perplexity 整体问答的可靠性会更高一些,ChatGPT 4.0 目前的版本似乎还是不能很好使用联网搜索的功能
其次在产品设计上面,Perplexity 通过 Sources 这一栏的卡片展示,包括文中的标注,清晰标明了引用的来源,然而 ChatGPT 在这方面的展示不是很明显。
那么在一众使用 RAG 联网搜索的产品中,如何持续提升答案的可靠性和有用性?
- 对于搜索结果的重排:需要将高相关的搜索结果优先级提升
- 利用 LLM + RAG 的方式来总结高相关的搜索结果室
-
- 多模态(视频、图片)的数据能否被正确解析和处理
- 分块(Chunking)完 LLM 是否能够吸收到最高相关、精华的信息
- LLM 本身推理能力,包括是否进行特定微调来适应搜索召回总结的任务
2. 用户体验流畅,集成大模型后的服务延迟依然很低
- Perplexity 对比其他可联网的 Chatbot 类型的产品,整体体验下来很流畅,答案生成的速度非常快,几乎是在显示出找到的几个引用的来源后,就开始流式生成答案。相比于使用 GPT4.0 模型的 ChatGPT 要快上不少。
- 其次在产品设计上,首先给出引用和来源,可以让用户在等不及的情况下,提前点开引用的网页链接,来了解到部分信息,这也有便于增强用户对最终模型生成答案的信任度
4、 产品思考
4.1、搜索+内容市场
搜索的市场是建立在互联网内容市场之上的;
海外:谷歌收割了互联网从无到有,从 PC 端到移动端的流量,并且通过广告的商业模式对流量有定价权
国内:百度收割了 PC 时代的流量,进入电商时代,阿里收割了电商平台的流量,短视频+推荐信息流崛起后,字节收割了移动端时代的流量
公司 | 广告收入(2023 年) |
| 2387 亿 USD |
Meta | 1310 亿 USD |
字节 | 3500 亿 RMB |
阿里巴巴 | 2000 亿+ RMB |
今天的广泛的内容市场可以这么分:
左边杀时间,娱乐+生活资讯(部分科普和知识)、 中间广义的消费决策、右边知识市场
市场细分 | 主流商业模式 |
娱乐+休闲+生活资讯 |
|
消费决策 |
|
知识生产力市场 |
|
Perplexity 目标市场是广泛内容市场是一个子集,主要定位在生产力和知识的获取,用户画像偏小众,整体是欧美互联网近些年来所倡导的 工程师文化 + “Smart is the new Sexy”,引用 Aravind 自己说的用户“想让自己变更聪明的人(People Who want to be smarter everyday),这个人群大概有多少呢?
我们可以用知识工作者( Knowledge workers)的人口作为一个衡量标准,知识工作者指的是需要从事非例行/重复工作,需要通过运用知识进行思考和沟通弄解决复杂问题的人;比如银行柜员例行让你填表格,这就不算知识工作者,需要通过与人沟通解决客户问题销售产品其实算知识工作者,这也解释了下面的调研数据中为什么消费行业中占比高然而金融行业的比例低。知识工作者需要通过思考和沟通来解决工作中的问题,那么 Perplexity 这类产品会显著提升用户的效率并且很大程度上直接解决问题;
这部分人群在美国大概有 1 亿人,全世界范围内大概有 10 亿人。 如果只看美国这一个市场的话,加上大学生的话,大概有额外 1800 万,总共有 1.2 亿左右的人群的潜在市场。随着我们离 AGI 越来越近,就业市场会动态调整,逐步替换掉重复的例行工作,需要转型成为知识工作者的人会越来越多,我们可以认为这部分渗透率可能最终会占到整个劳动市场的 100%
那么这部分人群的痛点:希望能够快速获得准确可靠的解决某个复杂问题的答案,但是现有的信息检索方式没办法很好满足他们的需求
4.2、Perplexity VS Google
回到谷歌的定位,谷歌是整个内容市场的通用搜索引擎且作为互联网用户入口的心智早已形成,占整个搜索引擎市场超 90%, 目标用户是对互联网内容有诉求的范人群,谷歌搜索的用途更广泛
谷歌最常见的搜索 Query 如下:
基本上谷歌搜索的用例可以分为以下几类:
- 导航去 XXX 网站
- 信息型 Query ,一般来说答案是 check 一些事实就能得到的
-
- 球赛比分
- 怎么在 MAC 上面截图
- 今天的天气
- 探索型 Query,背后的问题是开放式的,需要通过探索不同信息源、提取信息学习、总结才能心里有数的
-
- 中国的历史
- 怎么学习沟通谈判技巧
- 引力波是怎么一回事
- 应用(根据搜索返回的一系列小组件工具)
-
- 计算器
- 单位换算
- 航班查询
那么 Perplexity 怎么和 Google 去竞争或者换句话说是否需要和 Google 去竞争?如果 Google 复制了 Perplexity 的功能是不是就结束了?
首先在目前阶段,Perplexity 支持的功能并不能很好提供在导航和信息型 Query 这两个用例上的价值,
谷歌 Search 是具有操作系统属性的,之上可以提供应用(谷歌提供了一系列的小组件来给到用户 “最快最准确的答案”)
Perplexity AI 的优势在于探索型的 Query 中偏向 知识和生产力类的用例,通过总结出可信的答案,提升用户的效率,帮助用户更快速的达成搜索的目的
我们可以认为答案生成(Perplexity AI)和结果页返回(Google Search)是两种产品逻辑,一左一右。那实际上用户的用例很多,两种产品逻辑其一都无法满足广义搜索人群的需求。那就看是 Google 向右走,兼容这部分的需求,还是 Perplexity AI 向左走,增加更多的 Features。
从竞争的角度来看,其实就三个方面
- 成本优势(互联网时代叫 体验优势)
- 差异化
- 专注
那么在短的时间和空间维度上来看,Perplexity AI 做到了体验优势;
那么差异化和专注只有时间上的优势和不断领先 0.5 代的先发优势,但这几点谷歌都可以很轻松复制。
所以应该怎么去看待和谷歌 PK 的问题? 创始人 Aravind 提到了 Google 作为市场的现任王者(Incumbent firm)会面临一个很大的挑战,叫创新者的困境(Innovators' dilemma)
这个挑战指的是商业模式成熟且成功的公司会陷入成功的陷阱,被现有的商业模式所限制,因为他们看起来什么都做对了(从内部决策到资源投入 都在帮助先有的业务范围增长),但是在面临 Disruptive Technology (创新性的技术可能创造的市场需求是很难估量的,原有的 Niche Market 可能会快速增长)的时候,很难摆脱业务的包袱和现有的资产。
我们看谷歌的商业模式,占据搜索入口来分发流量,通过广告来变现,这个商业模式非常成功,贡献了谷歌近 80%的营收。在这个商业模式中,谷歌做为平台,需要引导用户花时间去查看、点击不同的搜索链接。这里的商业模式倒退的产品逻辑设计是没有办法让谷歌变成一个答案引擎直接给出用户一个总结性的答案。从这个维度去看,作为创业的 Perplexity 更轻包袱更少,可以去设计一个产品并且另辟蹊径去创建一个可行的商业模式,不局限于 Adsense 和 Adwords 里面
4.3、Perplexity AI 怎么考虑商业化?
目前的商业化方式如下,根据 WSJ 报道,Perplexity 的 ARR 也达到了$20M。
- C 端高级功能订阅制 ,$20 每月
- B 端开发者 API 调用;To B 企业付费版本
其中 To C 端用户有免费版和付费订阅版本的服务,付费订阅的高级功能如下
从高级功能的价值点上不难看出,付费需要 cover 的成本主要在
- 高级的推理模型(GPT-4 和 Claude 3 也是要对外采买的)
- Pro Search 和 本地文件上传 无限次需要花费更多 token 和 GPU time 所带来的推理成本增加;
$20 定价策略也是直接对标 GPT-4 版本的 ChatGPT,对于用户心里来说,$20 的价值感其实是有锚定效应的,GPT-4 的用户付费意愿已经证明了在当前时间+空间的环境下,$20 是一个可以接受的价格;考虑到 GPT 联网搜索能力姗姗来迟+并不是很好用的现状(GPT store 2024 年 1 月发布),许多专业用户还是更认可 Perplexity 的价值,包括一众科技巨头的 CEO,例如老黄说他每天都会用
从产品推出一年半, 40 个人团队+1 亿美元的融资带来 $20M 的 ARR 来说,Perplexity 的商业化已经初步成功;
Perplexity 后续也宣布会逐步加入广告来进行商业化变现,主要形式是通过在每一个用户提问后生成的 follow-up 相关联的问题内加入原生的一些品牌广告,这部分可能更多是在用户问出关于消费决策类的问题时
目前看用户在一个初始问题下面,点击 Follow-up 问题持续提问的比例高达 40%,用户的粘性是很高的,代表着目前 follow-up 问题是用户体验很大一部分的组成,很多用户 thoughts-wandering 的过程都会被这个 follow-up 的问题所捕捉,再次进行搜索和答案生成。
从本质来看,广告的价值在于链接了潜在用户和广告主,对于广告主的价值在于增加变现的效率,但是对于消费者来说,这部分提升的价值和最后构成消费决策带来的价值一直都是比较难被衡量的,毕竟整个链路到消费者反馈的时候已经太长了。
对于 Perplexity 来说,如果需要增加广告的商业模式,在用户体验上,怎么去创造更加个性化的连接,更注重对于用户+消费者的变化是更重要的。
对于广义的消费决策类的问题,怎么样更快更好更个性化满足用户在做消费决策时候的痛点,广告所提供的产品和服务是否更真正是提供了增量的价值,对于 Perplexity 整个产品的体验是不是带来了附加值,都是要深度思考的问题,毕竟谷歌在创立初期也是喊出了没有广告的模式。
4.4、AI 公司从开始就需要做商业化吗?
这里要聊下 AI 公司什么时候开始商业化的逻辑,目前 Perplexity 是 免费版本(Freemium)+付费版本(Premium)的商业模式,也有 Perplexity AI 的早期投资人告诉 Aravind 现在还是免费版做市场规模,不要去做付费的时候。
这里也有几方面关于 AI 公司很早就做商业化的观点和看法:
- 情绪上: Midjourney 带的头,让大家看到了 AI 初创公司很快可以凭借 AI 带来的全新体验迅速和规模化商业化 ( $200M ARR,不需要外部投资,dau 近 3M)
- 业务运营:AI 前置训练成本+推理成本持续增加
- 投资方:市场上的资金更加理性,模型层的公司融到资了,应用层的还没有大规模起来
- 产品上:
-
- 明显的用户价值主张(Value Proposition),如果有的话可以很早就商业化,如果没有更要趁流量和尝鲜的热度去做商业化(早期各种套壳 GPT 产品 到后来的妙鸭前置付费等等)
- 提早入场,去验证 PMF,并且不断迭代模型和功能满足种子用户的需求
- 工具类产品的付费心智(海外)是比较明确的
5、展望 AI 搜索产品
虽然谷歌也推出了自家的 AI 搜索产品 Google GSE,用来弥补在 AI 搜索产品上的空白,但是其商业模式在背后掣肘。Google GSE 全面推出预估会带来 20 亿+美元级别的广告利润下降,再加上使用生成式 AI 服务所带来的模型费用,Google 在推进 AI 搜索产品的道路上肯定是非常谨慎的
那么市场上能否出现一个 AI 搜索产品和谷歌掰掰手腕。Perplexity AI 能不能成为一个 10 亿级别的产品,
虽然 Perplexity AI CEO 小哥在之前的采访说到 :“我们不用做到和谷歌一样的量级,可能只用拿到 5~10% 头部高质量用户就可以。这个量级大概是多少,可能是美国 8%~10%的一个搜索市场份额(相当于第二名 Bing 必应搜索的市场份额了),谷歌大概目前占 80~90%;即使是这样 Perplexity AI 还需要在增长的道路上一路狂飙,从目前的动作来说也不难看出,一方面积极发布移动端的 APP,增加新的功能,另外一方面不管是从做博客引流转化用户,和硬件厂商绑定(买 rabbit R1 用户免费赠送 1 年会员功能),还需要更多的付费用户,以搜索为基石发展出来的更丰富的商业模式和商业化变现手段
目前还有以下几个难题:
用户习惯:Google 几乎培养了一代人使用搜索的习惯,而新兴的 AI 搜索引擎目前还在早期 Adaptors 的增长阶段,AI 搜索引擎需要尽全力去做新的用户增长,面向未来培养用户
内容供给:内容创作者和网站通过 SEO 带来的定向流量和广告赚钱的生态已经非常成熟,AI 搜索产品目前还没有探索出有效支撑内容产业链上游创作者的可行的发展模式。如果只是靠爬虫+搜索,那么必定会出现各大优质的内容网站通过内容墙+反爬虫的方式把 AI 搜索产品拒之门外,那么拿不到好的内容源就谈不上给到用户最好的问答体验了。这类产品的核心是要拿到并匹配到高质量的内容并提供给用户,就目前的内容市场来看,大多数高质量的专栏媒体(例如金融时报、纽约时报)的内容都无法被直接引用,没有了专家观点后,内容的质量会下降
模型优化:除了高质量的内容供给外,另外一个问题存在于搜索结果重排的过程,如何给用户一个 AI 高质量的内容,重排模型应该以什么样的指标/目标函数去做优化,人工需要参与制定什么样的标准?目前已有不少的用户发现 Perplexity AI 引用的内容来源在部分时候也是 Google 搜索中排名头部靠前的内容,那么这部分重排的机制会如何影响整个生态和用户体验仍然是一个核心的问题。如何这类产品要做的就是生产力,高质量真实新闻+有效内容的专栏,让用户每天学习和进步,这些指标都是要被清晰定义的。
但也对整个产业和内容生态有可能从根本上带来的新的机会:传统的 SEO+广告的商业模式,优化的是某个商品和品牌的关键词,是以公司这样一个集体与用户交互,未来内容产业会更加走向 IP 化,用户会更加信任某个人的 IP+品牌所背书的内容,(比如在推特上,关注 AI 的工程师都会更倾向于相信前 OpenAI、Tesla 的 AI 总监 AK 老哥所发表的 AI 模型相关的观点),AI 搜索产品过滤掉了信息所附带的公司产品或服务这类软广+硬广的属性,更加注重于是”作者“的内容的可信度,直接连接了创作者和下游的用户,减少了之间的多个主体和商业环节流转的摩擦,也为个人内容创作者带来的新的机会。
回到 AI 搜索产品最新的发布信息
前几天在 OpenAI 官网改版,主页着重突出 Ask ChatGPT anything,一键提问,强调了 ChatGPT 问答的属性,并在轮播图中提到与 Sora、OpenAI Reserach、OpenAI ToB 版本相同等的重要性
随后又有 Twitter 多位知名爆料博主发推,标明 OpenAI 即将发布 AI 搜索类产品,并且原生支持天气等多样小工具,整体爆出来的包括一系列的 UI 交互图,
从资金募集能力到用户量级(亿级的用户量)到数据量(背靠微软,可以拿到 Bing 的数据,ChatGPT 也有更丰富的用户交互数据)上 OpenAI 进入该市场是更有可能产生巨大的推动,有意思的是,进入 AI2.0 时代以来,OpenAI 似乎每一步都走到了谷歌的痛点上,从对话产品到模型能力发布再到现在的 AI 搜索产品,每一次谷歌都是匆忙应战,似乎每一次应战的发布会都被比了下去,就看这一次爆料的 OpenAI 5 月 9 号产品发布会和 Google I/O 5 月 15 号发布会所带来的新内容了