pandas 处理 人口数据 学习案例

这篇博客介绍了一次使用pandas进行美国各州人口数据分析的案例。首先从网络获取数据,然后通过合并数据框,处理空值,如将Puerto Rico的abbreviation设置为PR,填充USA的相关信息。接着,删除不合理的人口空值,最终得到完整的数据,并计算人口密度。通过案例展示了如何在pandas中进行数据清洗和操作。
摘要由CSDN通过智能技术生成

数据来源网络 美国各州人口分析

首先。导入所需模块

import pandas as pd
from pandas import DataFrame,Series

将数据文件导入 abb 为州名及简写 area 各州面积 pop 人口信息

abb = pd.read_csv('./data/state-abbrevs.csv')
area  = pd.read_csv('./data/state-areas.csv')
pop = pd.read_csv('./data/state-population.csv')

查看数据大小

display(abb.shape,area.shape,pop.shape)

数据样式

display(abb.head(),area.head(),pop.head())

显示结果如下
人口信息
现将三张dataframe 合并
首先是abb area

abb_area = pd.merge(abb,area,how='outer')

how='outer’表示保留两张表不同信息。可能出现空值。要处理空值。

abb_area.isnull().sum()

获取空值索引

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值