自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据分析知识点归纳

文章目录自我介绍如何搭建业务线指标体系:1.用户规模和质量2.参与度分析3.渠道分析4.功能分析5.收入分析自我介绍面试官您好我叫应李明,2018年本科毕业于北京邮电大学自动化学院,毕业之后我就职于中国工商银行数据中心,担任信息科技经理一职。主要参与跨部门的数据分析工作以及负责数据中心存储硬件及ZOS操作系统软件方面的工作,在工作期间主动参与完成了,融e购平台零售数据分析工作,通过对用户消费行...

2020-05-21 22:37:22 1855

原创 SQL常见面试题目

我们都知道 SQL 中的聚合函数,聚合函数顾名思义就是聚集合并的意思,是对某个范围内的数值进行聚合,聚合后的结果是一个值或是各个类别对应的值。如下所示:直接聚合得到的结果是所有店铺在这段时间内的所有销量之和,分组聚合(group by)得到的结果是每个店铺在这段时间内的销量之和。这种聚合函数得到的数据行数是小于基础数据行数的,但是我们经常会有这样的需求,就是既希望看基础数据同时也希望查看聚合后的数据,这个时候聚合函数就满足不了我们了,窗口函数就派上用场了。

2023-04-18 23:09:02 180 1

原创 HiveSQL常用技巧

文章目录1. 去重技巧—用group by替换distinct2. 聚合技巧–利用窗口函数grouping sets、cube、rollup3. 换个思路解题4. union all时可以开启并发执行5. 利用lateral view进行行转列6. 表连接优化7. 如何解决数据倾斜8. 如何计算按月累计去重9. 综合练习1. 去重技巧—用group by替换distinct取出user_trade中的全部支付用户## 原有写法SELECT distinct user_nameFROM user_

2020-06-28 14:46:56 344

原创 Python数据清洗总结

文章目录1.数据清洗常用工具1.1numpy1.2pandas2.文件读写2.1 CSV文件读写2.2 Excel文件读写2.3 MySQL文件读写3.数据表操作3.1 数据常用的筛选方法3.2 数据增加和删除3.3 数据修改和查找3.4 数据整理3.5 层次化索引4.数据转换4.1日期格式数据处理4.2 高阶函数数据处理4.3字符串数据处理5.数据统计5.1 数据分组运算5.2 聚合函数使用5....

2020-05-21 21:38:29 1668

原创 逻辑回归练习案例

文章目录基础代码 data=data.replace(to_replace="?",value=np.nan) data=data.dropna(how='any') data[column_names[1:10]].head() from sklearn.cross_validation import train_test_split X_train,X_test,y_train,...

2020-04-26 20:19:49 1076

原创 AB测试学习

为什么需要AB测试:

2020-04-03 23:23:42 780

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除