python从入门到住院_数据分析 | 零基础入门数据分析(三):从入门到住院?

本文是作者娜娜酱分享的Python数据分析入门教程,通过清洗知乎数据,统计知友地域分布和学校粉丝数,用Python进行数据处理和可视化。文章适合初学者,介绍了数据清洗、统计分析和图表制作的步骤。
摘要由CSDN通过智能技术生成

大家好,我是人生苦短python娜。o(〃'▽'〃)o

也许,我们昨夜才雄心勃勃定下的目标,今早醒来就忍不住泄气了。我很想告诉你一件事:在未来会有一个全新的你,别把他困在你旧旧的身体里!两个月前,我还是个传统行业里人称捧着铁饭碗的国企娜,决心辞职的那一刻,脑海里也确实有两个小人在挣扎:26岁才开始学xxxx晚了吗?难道不晚吗?晚吗?不晚吗?

我躺在床上,绝望地盯着天花板,花了30分钟勉强说服自己:눈_눈

世界上大大小小的错误大概可以分为三种,有一种错误是绝对不能犯的,比如杀人放火;还有一种错误是最好不要犯的,比如离婚;最后有一种错是犯了也没多大关系的,比如娜姐我26岁了从国企辞职。就算这是个错误的决定又怎么样,混得不好又怎么样,最坏的结果不过就是兜兜转转找了一圈还是没找着工作而已,天又塌不下来,让我们都脸皮厚一点也自私一次吧,天塌下来让个儿高的人去顶着!

人生苦短,去尝试你喜欢的事情为时不晚。

所以,和我一起向前迈出一小步吧!

娜娜酱的第二个python学习小作业:知乎数据清洗整理和结论研究作业要求:

1、数据清洗 - 创建函数去除空值

2、问题1 知友全国地域分布情况,分析出TOP20

① 按照地域统计 知友数量、知友密度(知友数量/城市常住人口)

② 知友数量,知友密度,标准化处理,取值0-100,通过多系列柱状图,做图表可视化

3、问题2 知友所在不同学校拥有粉丝数情况,分析出TOP20

① 按照学校(教育经历字段)统计粉丝数(‘关注者’)、关注人数(‘关注’),并筛选出粉丝数TOP20的学校

② 通过散点图,横坐标为关注人数,纵坐标为粉丝数,做图表可视化

知乎数据.csv示意

足智多谋娜娜酱(在jupyter notebook里做的):

1. 读取知乎数据,创建函数:用“缺失数据”替换字符型的空值,用0替换数值型的空值

处理后的数据大概长这样:

2. 按照地域统计知友数量、密度,并标准化处理,这里加载了一个常住人口的数据:

常住人口数据示意

3. 通过matplotlib包作bar chart

4. 问题2 分析知友学校拥有粉丝数情况,对学校校名进行一些简单处理(很多人的校名信息是乱填的,所以这里需要稍微注意一下),出散点图

有很多很多不足之处,欢迎指教!

以上就是从计算机白痴到会用python做一点点点点点数据分析的人生赢家娜娜酱,暂时还没有住院!请继续期待后续的打怪升级小作业~

这是零基础入门数据分析系列的第三篇,其他内容在这里:

(-'๏_๏'-)谢谢您阅读,请勿转载。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值