目录
1.人口数据分析
1.导入并查看相关文件信息
state表示州的全称,abbreviation表示缩写。
state表示州 areas表示所占面积。
state表示州,age表示调查人口的年龄,year表示统计年份,population表示人口数量。
2.进行数据操作
将人口数据和各州简称数据合并。
上图中有两列缩写,删除其中一列。
将state空值对应的简称找到
对简称进行去重
给为空的state补上正确的值,从而去除nan。
利用之前判别是否存在nan检测操作是否成功。
将面积数据进行合并
删除面积为nan对应的行。
找出2010年全部年龄人口数据
计算各州人口密度,排序并找出人口密度最高
完整代码如下:
import numpy as np
import pandas as pd
from pandas.core.indexes.base import Index
abb=pd.read_csv("state-abbrevs.csv")#state表示州全称 abbreviation表示缩写
#print(abb)
area=pd.read_csv("state-areas.csv")#state表示州 areas表示所占面积
#print(area)
pop=pd.read_csv("state-population.csv")#state表示州,age表示调查人口的年龄,year表示统计年份,population表示人口数量。
#print(pop)
#将人口数据和各州简称数据合并
abb_pop=pd.merge(abb,pop,left_on='abbreviation',right_on='state/region',how='outer')
# print(abb_pop.head(5))
a