- 博客(5)
- 收藏
- 关注
原创 <走进数据分析>课程学习笔记
当尝试探究两种变量是否具有相关性时,会分别对其进行分组研究(分组即为潜在变量);然而在分组比较中处于优势的一方,在总评中反而是失势的一方。比如:户型--家庭结构:成交个数(两相度)/占比(联合分布)/成交的家庭结构占比(边缘分布)/135户型的家庭结构分布(条件分布)对业务或研究中变量关系有重要影响,却没被列入研究范围的变量;(不为人知或数据无法获得)诊断分析:数值与数值变量/数值与分类变量/分类与分类变量。描述性统计(单变量分布)--诊断分析(变量间的关系)思考与分析(知识之间新联系)
2024-02-20 14:05:26 914
原创 <关键迭代--可信赖的线上对照实验>笔记
例如:指标用户幸福度或用户任务成功度,也许只能通过用户调研来直接衡量,这并非一个可以规模化的方法。但我们可以通过做调研或用户体验调研来观察哪些行为跟成功和幸福感相关联,你可以用线上日志做大型数据分析来探索这些行动的模式,以决定这些指标是否可作为高阶指标。一个实际的例子是跳出率,也就是那些只在网站上停留很短时间的用户比例,我们可能注意到"短时间的停留与不满意有所关联"。把这个观测跟数据分析结合起来就可以帮助确定精确定义1个指标所需的阈值(阈值应该是1个页面测览?20秒?
2023-12-01 18:03:02 1308
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人