需求:
1.导入文件,查看原始数据
2.将人口数据和各州简称数据进行合并
3.将合并的数据中重复的abbreviation列进行删除
4.查看存在缺失数据的列
5.找到有哪些state/region使得state的值为NaN,进行去重操作
6.为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN
7合并各州面积数据areas
8.我们会发现area(sq.mi)这一列有缺失数据,找出是哪些行
9.去除含有缺失数据的行
10.找出2010年的全民人口数据
11.计算各州的人口密度
12.排序,并找出人口密度最高的州
①
导入文件,查看原始数据
abb = pd.read_csv('./state-abbrevs.csv')
#state(州的全称)abbreviation(州的简称)
area = pd.read_csv('./state-areas.csv')
#state州的全称,area (sq. mi)州的面积
pop = pd.read_csv('./state-population.csv')
#state/region州/地区简称,ages年龄,year时间,population人口数量
</