产品经理如何看透数据分析“套路”

作者介绍

Simba

IBM资深商业分析师

IT职场老兵

终身学习者

本文约5千字,略读需要8分钟,精读需要15分钟,随时欢迎回来看。
引言
”单纯的数字是没有灵魂的,而背后的业务却是鲜活的。” 然而,
是不是我们每遇到一个新的业务场景都要将已经学到的数据分析知识推倒重来?
我现在知道怎么度量自己的产品,那别人的产品是怎么度量的?我的产品度量方法还有哪些可以改进的地方?
这是萦绕在产品经理小P脑海中的一个问题,小P想着多交些数据分析的朋友,于是加入了一个“数据人的自留地”的一个群(没错,这就是个软广告,点击上方数据人的自留地关注公众号,或者文章末尾扫码入群哦),在这里发现有人正在问数据分析“工具”选择的问题。对! “工具”,既然没有办法查阅所有的产品,但是我却可以查阅市面上大部分的数据分析工具呀,而数据分析工具的能力正是产品度量方法的高度抽象。于是小P便开始了他的体(窃)验(取)之旅,从具象的工具探索产品度量方法的高度抽象–即数据分析的“套路”。
作为一家国际化B2B SAAS 平台的产品经理,小P选择的工具也是遍布海内外:
Google Analytics(谷歌分析)–可算是网站分析的大佬了。

Amplitude – 这款是号称硅谷独角兽,但是在国内知名度却不高。

百度统计 --相当于中国的谷歌分析。

神策分析 – 2015年才成立的,不过市场增长很快。

诸葛IO – 号称"深入业务场景的用户行为数据分析"。

Growing IO – 国内领先的一站式数字化增长整体方案服务商。

数据分析的“套路”

历经几个礼拜的体验之旅,小P总结出了自己 “旅行攻略”:数据分析最终是要帮助业务认识几个哲学问题:

他们是谁? ----即全方位了解你的用户。

他们从哪里来? ----即如何实施产品Go To Market战略,将产品推向市场。

他们(来你这里)干了什么? ----即从用户行为度量、改进产品能力。

他们即将往哪里? ----分析流向并预测。

举个例子,在小P负责的B2B SAAS电商平台中:
他们是谁? — 就是平台上的买卖双方。

他们从哪里来? —这个平台在不同渠道投放广告,我们需要知道哪个渠道来的人多,哪里来的客户比较优质,哪个渠道性价比更高。

他们(来你这里)干了什么? — 客户来了,购买方看了些什么页面,最后有没有购买。

他们即将往哪里? —用户流程是否通畅,是否大部分客户都如你设计的一样走完流程,他们是否跳到了某些外部站点,有些工具还能预测具有某些行为的客户购买产品的可能性有多大。

听起来不难,不过深入探究一下也是有不少坑,接下来就和小P一起看一下数据分析中怎么定义这几个哲学问题。

1. 他们是谁?即全方位了解你的用户

在google analytics/Growing IO神策/中的表现依次如下:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

很容易看出这几款工具都会关注和用户相关的几大指标:
活跃用户数

新增用户数

X日留存率

先看什么是“用户”

常见的有以下几种:
在这里插入图片描述

把设备作为一个用户单位。比如Google analytics中用户的概念就是按照Cookie ID来定义,同一个用户在手机端、电脑端、pad端登陆都会当做不同的用户。

把登陆会员作为用户。如果我们把用户都按照第一种定义来看,对于某些产品可能会出现极大的误导,比如客户在手机端查看到一个邮件通知,需要回复邮件,邮件内容在PC端,于是他打开电脑,回复了邮件。这时候假如有个指标是要评估邮件回复的比率,那么在手机端的那个用户就不会有回复邮件的动作,而在PC端这个用户也不会有查看邮件通知这个动作。这个这个时候就需要把登陆用户作为用户来统计邮件回复的比率。

以客户组织为单位来定义。注意这里是客户,并非用户,常见于B端产品。比如某公司购买企业协同软件Slack,这个公司有100个人,那么这100个人就是产品用户,而公司本身是产品的客户。一度时期,Slack将新建/活跃账户个数定义为北极星指标,这里的账户个数,这就是以客户为单位来定义的。

看完“用户”这个概念,我们来看“时间定义”

定义时间段

比如每日活跃、新增数,7日留存,这个“日”是怎么的呢?一般有两种:
一种按照自然日

一种是按照24 小时为一天。

比如,某个App使用时间一般是在刚开始上班的时候(类似考勤打卡工具),我们拉新活动在头一天开始,第二天早上的上班时间早上八点用户登录了,这时候虽然不满24小时,我们仍然需要将此用户定义为day1留存用户,这时就是按照自然日来计算。如果没有这种特定时间使用的限制,或者是一个国际化的产品,我们可以一天定义为24小时。
再来看“活跃、新增、留存”。

如何定义“活跃、新增、留存”

活跃

通常来讲,“活跃”一般是只要用户有过访问记录,即可以认为是活跃。例如google analytics 中对活跃的定义是:
“ActiveUsers: the number of unique users who initiated sessions on your site or app ona specific day.”(在某天产生session记录去重后的用户总数)。
而在神策分析中,用户还可以自定义“活跃”用户为满足一定行为记录的用户。比如在内容类工具的创作者一侧,我们可以定义为“有过发表内容的记录”。社交类工具中,把有过沟通记录定义为活跃。

在这里插入图片描述

新增

这个概念和用户的定义紧紧关联。如果把设备作为一个用户单位,假如同一用户用不同设备登陆,或者用不同设备登陆,但是却清理过浏览器缓存,cookie ID 会更新,那么也是计为一个新增用户。对于另外两中用户定义的情况也是以此类推。

留存

通俗的讲,留存就是拉新过程中,你会发现经过一段时间,总有用户流失,留存就是来衡量有多少用户留下来了。
小P 在想,我的产品是个B2B 平台,卖方买方都是企业客户,购买行为也是低频,留存率好像并不适合我的产品。他就去请教一个留存专注的大佬。
大佬:“为什么要看留存?”
小P:“想看你的产品有多少客户留下来了”
大佬:“为什么想看有多少客户留下来了?”
小P:“看看我的产品是不是足够吸引人?"
大佬:“然后,如果留存率不高呢?”
小P:“想法变高。”
大佬:“怎么变高?”
小P:“额,额,这个就要具体看…”小P打算把产品的方法论给大佬讲一下,却被大佬打住了。
大佬:“打住,留存除了衡量产品吸引力之外,更重要的是帮助你发现两个要素:
1.核心客户,即哪些客户更容易留下来,是否后续应该加强对核心用户的服务工作。
2. aha Moment(啊哈时刻),即有哪些行为是促成留存转化的重要行为,是否后续应该增强对这个行为的支持,你可以看看facebook通过发现aha moment 促成增长的案例。
永远记住,数据不是终点,而是起点。…"
小P醍醐灌顶:“所以对我负责的这个B2B平台的产品而言,通过留存分析,发现那些经常来的用户,尽管可能很少,但是可以研究他们的行为来增强某些功能的改进。也可以帮助发现是否有个促成下单的aha moment。”
大佬:“聪明!而且在互联网下半场时代,留存会越来越重要,过去的海盗增长模型AARRR 已经逐渐演变为现在的RARRA 增长模型,也就是做到先做好留存,打磨产品,然后在引爆。Retention 作为第一重要增长要素,已经非常重要了”
小P:“哇,又知道了好多新知识”。
就在小P搞明白了为啥要做留存的第二天,负责运营的一个小伙伴来找小P,我们这边有个SAAS卖家,提了这么个要求,他们想知道那些申请试用SAAS 产品的用户,都试用的怎么样,看看怎么能提高试用到付费版的转化率,对了,他们的产品是个专门给销售用的CRM系统,日常都应该会使用,你想想怎么搞。
“这不就是看留存吗?” , 小P 暗喜。他立即去看数据分析工具里对留存的定义,下面是神策demo中给出的定义方法:
在这里插入图片描述

所以,在留存分析中,我们需要定义以下几个参数:
1.定义一个初始行为,即拉新的行为是什么,在这个例子中,小P定义为“申请试用” 行为。
2.定义一个后续行为,即如何认定“用户留下来了”,这个例子中小P 定义为 “登陆访问CRM软件”
3.定义一个时间频率,按天,或者按周。运营说,这个CRM系统是专门给销售用的“日常”使用工具,那么我们看每“天”的留存。
4.定义一个时间段,即观察多少天的留存。这款软件的试用期是7天,那么定义为7天吧。
定义好这些之后,留存是怎么计算的呢?举个栗子:有一个鼓励试用的活动持续2天,我们来看3日留存率的计算。
· 10月1日,1000人试用;第一天这1000人中300登陆CRM软件;第二天,有200人登陆CRM软件;第三天,有150人登陆CRM系统。
· 10月2日,1500人试用;第一天有400人登陆CRM软件;第二天有200人登陆CRM软件;第三天有150人登陆CRM系统。
那么:
· Day1 留存率为(300+400)/(1000+1500)
· Day2 留存率为(200+200)/(1000+1500)
· Day3 留存率为(150+150) /(1000+1500)
假设计算之后,我们得到这样一个图表,可以看出来用户在第一天留存急剧下降,而之后就稳定下来了,就可以分析稳定下来的这批用户都做了什么,而没有留下了的这批用户没做什么,是不是能帮助发现核心用户和aha moment(啊哈时刻)。在这里插入图片描述

半年后,小P负责的B2B 平台引入了留存分析的工具供平台上的SAAS卖方们使用,大家连连称赞:“我们自己想做的东西,你们平台都替我们做了,终于可以帮助我们看为啥我们产品的试用转付费的转化率低了,看看留下来的客户干了什么,反过来就能看到哪些行为能让客户留下来,太棒了!”。
小P心中的自豪感油然而生。
三个指标都搞清了,小P 还发现各大工具中有个重要的功能,叫“用户分群”。
用户分群:

给“他们分类”

用户来了,对不同的用户需要区别对待,就需要对用户分群,这也是精细化运营的前提。我们先来看诸葛IO 和amplitude 里的表现。
诸葛IO :

在这里插入图片描述

Amplitude

在这里插入图片描述

诸葛分析里定义用户群是根据:做过或者没做过、新增于…什么时候、活跃于…什么时候、用户属性满足…。而amplitude 里除了上述几个类似,还有一个“Have prospensity”。什么是prospensity(倾向性)呢?
我们先将用户分群依据的特征分类,大概分为属性类特征,行为类特征,预测类特征,这三类特征按照分析深度依次递进。
属性类特征:主要是客户的客观事实特征,不会以我们的分析方法而变化。C端有性别、年龄、姓名、居住地。B端产品有公司规模、所在行业等。

行为类特征:一部分是用户行为本身,也包含针对行为的统计类特征,比如访问过某个页面几次,从什么时间开始活跃,等等,这类特征的定义和“用户做了什么” 紧密关联,别急,后续我们可以针对行为详细展开描述。

预测类特征:就是在Amplitude 对应的“have propensity”。在Amplitudesupport里对获取 propensity的方法是这样描述的:Predictions use past behavior to predict future behavior. Amplitude starts bylooking at users who were in the starting cohort two periods ago, and will thenidentify which of those users did vs did not perform the action one period ago(a period can be set to seven, 30, 60, or 90 days). Next, Amplitude comparesthose two groups of users along three sets of variables. 详见原文(https://help.amplitude.com/hc/en-us/articles/360049161832)

举个例子,电商网站中,我们把历史上某个时间段内,付费下单的客户和没有付费下单的用户分为两类,对这两类客户的行为,行为属性和用户属性进行分析。我们将这种行为来训练出一个线性回归模型,再以此模型预测客户下单付费的可能性。
不得不说,智能预测功能未来一定是数据分析类工具的一个魅力属性,具备此类能力的工具也是走在分析类工具的前列。而数据分析工具本身并不拥有数据,却要提供这样的能力,是非常难能可贵的。
当然用户分群只是开始,分群的目的终究是为业务服务,对不同人群进行分析,并做出行动(比如发push,针对核心人群改进产品)才是最终目的。
到目前为止,我们终于知道 “他们”是谁了,那么,他们从哪里来?你需要更多的信息。

2、他们从哪里来?

即通常所说的流量,我们先来看看google 分析和百度统计中关于流量的展示:

在这里插入图片描述
在这里插入图片描述

之所以拿google 分析和百度统计做对比,是因为二者都是搜索引擎,都可以利用自身搜索引擎的优势来告诉客户:客户往往通过搜索什么关键词来到你的网站。如下图所示:
在这里插入图片描述
在这里插入图片描述

实际上Google analytics最初的形成也是源于google 内部的一个需求:我们如何向客户证明google 广告为客户带来了流量。对于客户而言,也需要知道投放广告有没有用,哪里投放活动获得的优质客户更多,从而帮助制定产品走向市场的战略,在硅谷的职业分类里有一个角色叫PMO(Product MarketingOwener),有点类似国内的运营类岗位,流量就是他们最关注的一项内容。
流量本身是比较好理解的,即你的用户来自哪里,但你仍然需要区分一个概念,即Source 和media。比如你在CSDN 做了一个广告,在CSDN 网站内部,也有人推荐了你的网站,那么这时候你需要知道到底是广告起作用了,还是别人的推荐起作用了,所以在google analytics 里,就有了source 和media 的概念。
Source: 流量的起源

Media:传播的媒介

弄清楚流量分布,小P牢牢记住了大佬说的一句话“数据只是起点,不止是终点”,那么这个起点可以领我们去哪里呢,如果发现某个渠道来的客户特别多,是不是我们就应该加大这个渠道的推广呢?小P发现,在google 分析中还提供了不同渠道的bounce rate, conversions,神策的渠道分析中也提供了转化率分析的图表。
在这里插入图片描述
在这里插入图片描述

看来我们不仅要看渠道带来的客流数量,更要看客流质量。上述的跳出率、转化率就是两个衡量渠道质量的重要指标。他们分别是这样定义的:
跳出率:是有业界统一的定义的,即有多少人来到页面之后(这里更多是着陆页)没有任何动作就走了。举个例子,假如在地铁口有人发广告给你说“某店全场五折”,你一听五折就进店去看一下,结果刚进门,发现是个烟酒商店,而你从来不抽烟喝酒,这种情况下,你基本会立马转身,不再探索,你的行为就是一条跳出记录。导致跳出率高有很多原因。但如果多个渠道对比,有的渠道跳出率高,有的渠道跳出率低,那么跳出率高的原因多数就是产品投放渠道不合适了。如果多个渠道跳出率都高,可能就是着陆页本身不好了。值得注意的是,多数情况下,跳出率一般用于衡量着陆页,并不适合衡量所有页面的质量。

转化率:即有多少人来了之后成功转化。客户的需求是否迫切真实,不仅要看他浏览了什么,还要看他做了什么,转化成功就是客户有实质行为(比如付费、注册)。如果多个渠道对比,有的转化率高,有的转化率低,那么也能作为一个投放渠道是否高质量。所以转化率的定义,一定是有行为支撑的。比如神策分析中,就可以定义漏斗转化的行为。
在这里插入图片描述

这让小P想起很久以前他们刚刚开始做推广他们的B2B平台,他们当时分别用了google 搜索和线下SAAS厂商峰会来做推广,很明显的线下峰会的渠道质量会高很多。当然线下峰会的成本也会高很多。但是到底哪个更划算,没有人能说清楚。如果当时能做这样的跳出率、转化率分析,就能给出大概的成本收益了。
到目前为止,小P大概搞清了用户是谁,用户来自哪里,接下来用户干了什么,用户去向哪里。小P后续带你走完这场“数据分析的探索之旅”,敬请期待。
[未完待续]

参考文献
Google analytics support 文档: https://support.google.com/analytics/?hl=en

Amplitude 技术文档:https://help.amplitude.com/

神策数据官网:https://www.sensorsdata.cn/

诸葛IO官网:https://zhugeio.com/

百度统计官网:https://tongji.baidu.com/web/welcome/login

Growing IO 官网:https://www.growingio.com/

一个数据人的自留地是一个助力数据人成长的大家庭,帮助对数据感兴趣的伙伴们明确学习方向、精准提升技能。关注我,带你探索数据的神奇奥秘

1、回“数据产品”,获取<大厂数据产品面试题>

2、回“数据中台”,获取<大厂数据中台资料>

3、回“商业分析”,获取<大厂商业分析面试题>;

4、回“交个朋友”,进交流群,认识更多的数据小伙伴。

  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 打赏
    打赏
  • 扫一扫,分享海报

参与评论 您还未登录,请先 登录 后发表或查看评论
©️2022 CSDN 皮肤主题:游动-白 设计师:我叫白小胖 返回首页

打赏作者

数据掘金者

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值