- 博客(6)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 数据分析知识点归纳
文章目录自我介绍如何搭建业务线指标体系:1.用户规模和质量2.参与度分析3.渠道分析4.功能分析5.收入分析自我介绍面试官您好我叫应李明,2018年本科毕业于北京邮电大学自动化学院,毕业之后我就职于中国工商银行数据中心,担任信息科技经理一职。主要参与跨部门的数据分析工作以及负责数据中心存储硬件及ZOS操作系统软件方面的工作,在工作期间主动参与完成了,融e购平台零售数据分析工作,通过对用户消费行...
2020-05-21 22:37:22
1855
原创 SQL常见面试题目
我们都知道 SQL 中的聚合函数,聚合函数顾名思义就是聚集合并的意思,是对某个范围内的数值进行聚合,聚合后的结果是一个值或是各个类别对应的值。如下所示:直接聚合得到的结果是所有店铺在这段时间内的所有销量之和,分组聚合(group by)得到的结果是每个店铺在这段时间内的销量之和。这种聚合函数得到的数据行数是小于基础数据行数的,但是我们经常会有这样的需求,就是既希望看基础数据同时也希望查看聚合后的数据,这个时候聚合函数就满足不了我们了,窗口函数就派上用场了。
2023-04-18 23:09:02
180
1
原创 HiveSQL常用技巧
文章目录1. 去重技巧—用group by替换distinct2. 聚合技巧–利用窗口函数grouping sets、cube、rollup3. 换个思路解题4. union all时可以开启并发执行5. 利用lateral view进行行转列6. 表连接优化7. 如何解决数据倾斜8. 如何计算按月累计去重9. 综合练习1. 去重技巧—用group by替换distinct取出user_trade中的全部支付用户## 原有写法SELECT distinct user_nameFROM user_
2020-06-28 14:46:56
344
原创 Python数据清洗总结
文章目录1.数据清洗常用工具1.1numpy1.2pandas2.文件读写2.1 CSV文件读写2.2 Excel文件读写2.3 MySQL文件读写3.数据表操作3.1 数据常用的筛选方法3.2 数据增加和删除3.3 数据修改和查找3.4 数据整理3.5 层次化索引4.数据转换4.1日期格式数据处理4.2 高阶函数数据处理4.3字符串数据处理5.数据统计5.1 数据分组运算5.2 聚合函数使用5....
2020-05-21 21:38:29
1668
原创 逻辑回归练习案例
文章目录基础代码 data=data.replace(to_replace="?",value=np.nan) data=data.dropna(how='any') data[column_names[1:10]].head() from sklearn.cross_validation import train_test_split X_train,X_test,y_train,...
2020-04-26 20:19:49
1076
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人