精益数据分析（学习笔记）——长期更新

最新推荐文章于 2024-02-19 17:04:54 发布

一枚达达

最新推荐文章于 2024-02-19 17:04:54 发布

阅读量720

点赞数 1

文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48457572/article/details/113925578

版权

本文来自阅读书籍《精益数据分析》的学习笔记，加上自己的一些理解，整理出来的思路。

精益数据分析的周期：

上面这张图概括了书籍第二章的内容。

精益数据分析的核心，即上图的这整个周期：

1. 确定一个好的数据指标；

这个指标是根据所面对的问题或者业务来确定的。对于企业来说，就是推动公司业绩增长的指标，即关键绩效指标（KPI）。

书中说，一个好的数据指标，应当是比较性的、简单易懂的，通常情况下是一个比率。

有五种指标的分类，或者说是评估指标的参考：

定性指标、定量指标

定性，即”好、坏、一般般“，形容词；定量，即”1000万、增加120%“，带具体数值。

虚荣指标、可付诸行动的指标

虚荣指标，即好看但没太大用，比如访问量、注册会员数等，大概率只会随着时间增长，对业务改进没太大用；

可付诸行动的指标则相对。

探索性指标、报告性指标

探索性指标，即挖掘一些潜在的我们还不知道的影响因子，得到的一些我们没得到过的指标；

报告性指标，即跟随公司日常战略，持续关注的明面上的指标。

先见性指标、后见性指标

先见性指标，即预测未来，加以防范；

后见性指标，即已遭此劫，亡羊补牢。

相关性指标、因果性指标

相关性指标，即有联系，但不一定是因果，比如因为进入夏天，冰淇淋销量和溺亡人数都上升，但并不是因为冰淇淋销售导致溺亡，他们相关但不是因果；

因果性指标，即因指标导致了果指标，这可能是多对一的，多个因导致一个果。

2. 在确定需要关注的指标后，公司要找到影响这个指标的因子，分析的方法在书里叫做测试。

测试就是通过以下四个板块，来比较和分析两个样本的不同：

市场细分

就是通过数据挖掘，发现用户的共同特征，针对特征进行业务的改进。

A/B测试（横向对比）

市场细分就比较玄学，全靠想象的感觉，而AB test就做实事。

假设其他条件保持不变，仅考虑体验中的某一属性(如链接的颜色)对被试用户的影响，就是 A/B 测试。

A/B测试有个软肋，就是需要逐一对比，得到单一因素的效果。对于大型网站来说，用户多，可以迅速得到答案；小网站得到足量的反馈就比较慢。

如果版本的改动比较大，那么就比较费时。

同期性分析（纵向对比）

应该把用户按照使用产品的时间进行分类，意思就是，从发布就开始玩这款游戏的玩家，和刚入坑的玩家，他们的想法和体验是不同的，因此需要分开分析。

多变量测试

进行一连串的单独测试会延长你走向成熟的周期。

多变量测试，原理为，用统计学方法剥离出单个影响因子与结果中某一项指标提升的相关性。（比如线性回归模型的系数的p-value？）

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
精益数据分析（学习笔记）——长期更新

本文来自阅读书籍《精益数据分析》的学习笔记，加上自己的一些理解，整理出来的思路。精益数据分析的周期：上面这张图概括了书籍第二章的内容。精益数据分析的核心，即上图的这整个周期：1. 确定一个好的数据指标；这个指标是根据所面对的问题或者业务来确定的。对于企业来说，就是推动公司业绩增长的指标，即关键绩效指标（KPI）。书中说，一个好的数据指标，应当是比较性的、简单易懂的，通常情况下是一个比率。有五种指标的分类，或者说是评估指标的参考：定性指标、定量指标定性，即”好、坏、.
复制链接

扫一扫

博客等级

码龄4年

12
原创

11
点赞

53
收藏

8
粉丝

关注

私信

热门文章

最新评论

分类与逻辑回归(classification and logistic regression)
一枚达达: 嗯嗯是的，我的理解是classification的英文释义是“分类”，分类是我们要解决的问题也是目标，像kmeans这种无监督学习，就是没有target但其实也算是一个分类问题，即把空间点分为几组聚“类”；logistic则相对的是监督学习问题，最终通过训练一个模型，实现的也是将没有target的test集预测出他们属于哪一类。即我的理解是logistic是一种实现classification的方法
分类与逻辑回归(classification and logistic regression)
橘猫吃鸡腿: classification还是包括LDA，贝叶斯那些吧，感觉区别是logistic你知道结果是A还是B，classification的话你不知道结果是什么，只管分类，有监督和无监督的区别，个人感觉，欢迎指正
分类与逻辑回归(classification and logistic regression)
一枚达达: classification是一种问题，logistics regression是解决分类问题的一种模型或者方式
分类与逻辑回归(classification and logistic regression)
橘猫吃鸡腿: 所以logistic和classification有啥区别
凸优化解决线性回归问题
不吃西红柿丶: 平凡文字中显示出不凡的文学功底，哈哈哈哈哈哈。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。