![ef2876f0540762503064e45e5cdd040d.png](https://img-blog.csdnimg.cn/img_convert/ef2876f0540762503064e45e5cdd040d.png)
一提到数据分析,大家脑海中立刻想到的是SPSS, R, Python, Java进行“高大上”的建模工作。实际上,由于成本、时间的局限,数据分析师用的最多的工具反而是SQL数据库和Excel,把数据从数据库中导入到Excel进行数据分析。
下面以一个实际例子举例:
![71be8e6f05d7b61481c5271016346702.png](https://img-blog.csdnimg.cn/img_convert/71be8e6f05d7b61481c5271016346702.png)
图表显示的是某app在2019/4/29-2019/8/26的用户参与度波动,可以看出2019/7/29是参与度下降的起点,然而在当时无法判断该下跌是否属于自然波动,因此我们继续观察下一个时间点——2019/8/5时参与度仍然下降,不得不引起注意。
为了从数据角度找到参与度下降的原因,要利用到三张表course.pigeon_user, course.pigeon_events, course.pigeon_emails。
![e945d3a621d1dbe66205958ce1d9fbc2.png](https://img-blog.csdnimg.cn/img_convert/e945d3a621d1dbe66205958ce1d9fbc2.png)
![b33acdf435b792c29c5934fd4c5196ab.png](https://img-blog.csdnimg.cn/img_convert/b33acdf435b792c29c5934fd4c5196ab.png)
![57e379c99c7b1a72a8225cf86acad397.png](https://img-blog.csdnimg.cn/img_convert/57e379c99c7b1a72a8225cf86acad397.png)
以上三张表可以用user_id这个字段进行拼接查询。
结构化思维开始
尝试从结果倒推原因。
一,用户参与度下降,会不会是用户增长减少了?能找到发生的时间点吗?跟运营或相关同事了解是否那段时间有运营活动或舆论发生了改变?
select min(created_at) min_date,
max(created_at) max_date
from course.pigeon_users;
![55692e56fe2ec76045f7bc9c7fb96046.png](https://img-blog.csdnimg.cn/img_convert/55692e56fe2ec76045f7bc9c7fb96046.png)
select distinct state
from course.pigeon_users;
查询可得state只有两种状态&