基于pandas人口分析案例

GODamnbit

于 2022-08-04 15:45:40 发布

阅读量308

点赞数

本文链接：https://blog.csdn.net/qq_40202164/article/details/126160868

版权

本文档通过pandas库分析人口数据，包括数据文件导入、数据合并、处理重复与缺失值，以及计算人口密度，最终找出人口密度最高的州。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

人口分析案例

数据文件

下载数据文件

需求&解决

导入文件，查看原始数据

abb = pd.read_csv('./Data/state-abbrevs.csv')  # state(州的全称) abbreviation(州的简称)
area = pd.read_csv('./Data/state-areas.csv')  # area (sq. mi) 州的面积
pop = pd.read_csv('./Data/state-population.csv')  # state/region(州简称) ages(年龄) year(时间) population(人口数量)

将人口数据和各州简称数据进行合并

abb_pop = pd.merge(abb, pop, left_on='abbreviation', right_on='state/region', how='outer')

将合并的数据中重复的abbreviation列进行删除

abb_pop.drop(labels='abbreviation', axis=1, inplace=True)  # drop较特殊，1表示列，0表示行

查看存在缺失数据的列

# 方式1：isnull, notnull, any, all
abb_pop.isnull().any(axis=0<

最低0.47元/天解锁文章