![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
邢时
这个作者很懒,什么都没留下…
展开
-
数据开发用sparkRDD,hive会自定义udf函数
数据开发用sparkRDD,hive会自定义udf函数原创 2019-11-14 17:21:32 · 107 阅读 · 0 评论 -
维度
维度就是分析的角度,说着挺高大上,其实就是group by 加上维度原创 2019-11-13 10:16:22 · 292 阅读 · 0 评论 -
男女不同的消费频次
select tmp.sex,avg(tmp.ct) from(select userid,sex,count(1) as ct from order ojoinuser uon o.userid=u.useridgroup by userid,sex) tmpgroup by tmp.sex原创 2019-10-21 22:31:53 · 223 阅读 · 0 评论 -
复购率
select count(),count(if tmp.t>1, 1,null),count()/count(if tmp>1 1,null) resultfrom(select userid,count(*) tfrom ordergroup by userid) tmp原创 2019-10-21 21:51:37 · 175 阅读 · 0 评论 -
分析数据的方法(一)
1.象限法:划分数据2.多维法:分析角度更全面(但要避免辛普森效应——如果一个维度很低会影响总维度的平均值。可以通过下钻避免,下钻将某一角度更细致化)3.假设法:没有数据做出预判4.指数法:(加权、反比例、log)、5.二八法:最有价值的数据是20%...原创 2019-10-14 12:22:10 · 95 阅读 · 0 评论 -
数据分析的逻辑
1.结构化——金字塔形2.公式化(+,*)可以用来流动人数转化率=客户3.业务化(和业务人员沟通)原创 2019-10-14 12:17:47 · 392 阅读 · 0 评论