python人口普查数据数据分析_Python:第六次全国人口普查数据分析及可视化(pandas、matplotlib)...

本文使用Python的pandas和matplotlib库对第六次全国人口普查数据进行解析和可视化,包括全国男女年龄人口直方图和年龄阶段分布图。通过数据清洗和处理,展示各年龄段的人口分布情况。
摘要由CSDN通过智能技术生成

一、数据获取

在国家统计局网中下载第六次人口普通统计表:http://www.stats.gov.cn/tjsj/pcsj/rkpc/6rp/indexch.htm

然后通过pandas将excel数据解析为多级字典

先观察excel数据

576354ee48bfffcb24fb1deb210c64f1.png

可以转化为这样的多级词典:

c344b4e834136b49c9f94d9f96f0ffa9.png

理清字典关系后代码就简单了

def getDataDict():

#skiprows指跳过的行下标(下标从0开始),=2即从第3行开始,返回类型为dataframe

dataFrame = pandas.read_excel('D:/Py/2010人口普查.xlsx',skiprows=2)

#获取民族列表,民族字符串中有空格,通过map函数清洗数据

#iloc函数中表示解析下标为第0行,第1列之后的,并且步长为3;

#使用map函数后转化为了map类型数据,注意转回list类型

raceList = list(map(lambda s:str(s).replace("\xa0",""),dataFram

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值