瑟科塞斯-CSDN博客

目录ABtest实验漏斗分析用户画像辛普森悖论费米估计AARRR事件分析用户路径分析留存分析归因分析RFM模型ABtest实验数据分析——AB实验漏斗分析漏斗分析是指将某个业务场景中关联的事件，根据先后发生的顺序进行组织，从而系统性了解用户转化效率。漏斗分析不但可以整体性的反映用户在一定时间周期内，浏览网站或者APP中从起点到终点的转化率，而且还可以分析浏览过程中每一次跳转所产生的留存和流失，这样就能够直观地发现异常数据，从而通过分析根因找到问题所在，最后通过优化该环节来达到提升转化率的目标。漏

2022-05-06 23:53:33 575

原创数据分析学习中需要掌握的业务知识

数据分析工作需要学习的业务知识，面试和笔试经常能用到。

2022-05-03 13:35:47 596

原创如何成为一名数据分析师？

成为一名数据分析师需要的技能

2022-04-27 00:24:20 3390

原创 hive sql中常用技巧

hive sql中常用函数和技巧

2022-04-24 00:17:20 3793

原创详细叙述MySQL中所有数据类型（以MySQL 8.0 为例）

数据类型数值型字符型日期/时间型MYSQL支持多种类型，大致分为三类，数值、日期/时间、字符串（字符）类型。数值型类型大小范围（有符号）范围（无符号）用途tinyint1 Bytes(-128,127)(0,255)小整数值smallint2 Bytes(-32768,32768)(0,65535)大整数值mediumint3 Bytes(-8 388 608，8 388 607)(0，16 777 215)大整数值int 或 int

2022-04-23 15:54:38 1050

原创数据倾斜的原因及解决方案

数据倾斜数据倾斜定义数据倾斜表现数据倾斜原因数据倾斜解决方案1、group by导致数据倾斜2、count（distinct）特殊值较多3、join操作4、空值或数据类型不一致所致5、优化in/exists6、排序选择数据倾斜定义定义：对于集群系统，一般缓存是分布式的，即不同节点负责一定范围的缓存数据。我们把缓存数据分散度不够，导致大量的缓存数据集中到了一台或者几台服务节点上，称为数据倾斜。一般来说数据倾斜是由于负载均衡实施的效果不好引起的。举例：如果有10亿数据，一台电脑可能要10小时，现在集群有1

2022-04-19 00:02:06 8078