【博客地址】:https://blog.csdn.net/sunyaowu315
【博客大纲地址】:https://blog.csdn.net/sunyaowu315/article/details/82905347
需要数据分析、风控评分卡等相关数据、代码,请添加qq群:102755159,或留言联系笔者邮件发送!!!
如果对金融风控、机器学习、数据科学、大数据分析等感兴趣的小伙伴,可加微信交流(邮件中备注,我会附上微信号)
。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/d0f7a9cda2245899b31223ba2dbd98d8.png)
知乎数据清洗整理和结论研究
1、数据清洗 - 去除空值
- 要求:创建函数
- 提示:fillna方法填充缺失数据,注意inplace参数
2、问题1 知友全国地域分布情况,分析出TOP20
- 要求:
① 按照地域统计 知友数量、知友密度(知友数量/城市常住人口),不要求创建函数
② 知友数量,知友密度,标准化处理,取值0-100,要求创建函数
③ 通过多系列柱状图,做图表可视化 - 提示:
① 标准化计算方法 = (X - Xmin) / (Xmax - Xmin)
② 可自行设置图表风格
3、问题2 知友全国地域分布情况,分析出TOP20
- 要求:
① 按照学校(教育经历字段) 统计粉丝数(‘关注者’)、关注人数(‘关注’),并筛选出粉丝数TOP20的学校,不要求创建函数