·需求:
导入文件,查看原始数据
将人口数据和各州简称数据进行合并
将合并的数据重复的abbreviation列进行删除
查看存在缺失数据的列
找到有哪些state/region使得state的值为NaN,进行去重操作
为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN
合并各州面积数据areas
我们会发现area(sq.mi)这一列有缺失数据,找出是哪些行
去除含有缺失数据的行
找出2010年全民人口数据
计算各州的人口密度
排序,并找出人口密度最高的州
import numpy as np
import pandas as pd
# 导入数据,查看原始数据
abb = pd.read_csv("./data/state-abbrevs-Copy1.csv") #state(州的全称)abbreviation(州的简称)
abb
state abbreviation
0 Alabama AL
1 Alaska AK
2 Arizona AZ
3 Arkansas AR
4 California CA
5 Colorado CO
6 Connecticut CT
7 Delaware DE
8 District of Columbia DC
9 Florida FL
10 Georgia GA
11 Hawaii HI
12 Idaho ID
13 Illinois IL
14 Indiana IN
15 Iowa IA
16 Kansas KS
17 Kentucky KY
18 Louisiana LA
19 Maine ME
20 Montana MT
21 Nebraska NE
22 Nevada NV
23 New Hampshire NH
24 New Jersey NJ
25 New Mexico NM
26 New York NY
27 North Carolina NC
28 North Dakota ND
29 Ohio OH
30 Oklahoma OK
31 Oregon OR
32 Maryland MD
33 Massachusetts MA
34 Michigan MI
35 Minnesota MN
36 Mississippi MS
37 Missouri MO
38 Pennsylvania PA
39 Rhode Island RI
40 South Carolina SC
41 South Dakota SD
42 Tennessee TN
43