数据分析项目2-人口分析

最新推荐文章于 2024-04-12 09:02:28 发布

yxy618

最新推荐文章于 2024-04-12 09:02:28 发布

阅读量345

点赞数

文章标签：人口数据州简称合并缺失值处理人口密度数据清洗

本文链接：https://blog.csdn.net/yxy618/article/details/125848963

版权

·需求：
导入文件，查看原始数据
将人口数据和各州简称数据进行合并
将合并的数据重复的abbreviation列进行删除
查看存在缺失数据的列
找到有哪些state/region使得state的值为NaN，进行去重操作

为找到的这些state/region的state项补上正确的值，从而去除掉state这一列的所有NaN
合并各州面积数据areas
我们会发现area（sq.mi）这一列有缺失数据，找出是哪些行
去除含有缺失数据的行
找出2010年全民人口数据
计算各州的人口密度
排序，并找出人口密度最高的州

import numpy as np
import pandas as pd

# 导入数据，查看原始数据
abb = pd.read_csv("./data/state-abbrevs-Copy1.csv") #state（州的全称）abbreviation(州的简称)
abb

state	abbreviation
0	Alabama	AL
1	Alaska	AK
2	Arizona	AZ
3	Arkansas	AR
4	California	CA
5	Colorado	CO
6	Connecticut	CT
7	Delaware	DE
8	District of Columbia	DC
9	Florida	FL
10	Georgia	GA
11	Hawaii	HI
12	Idaho	ID
13	Illinois	IL
14	Indiana	IN
15	Iowa	IA
16	Kansas	KS
17	Kentucky	KY
18	Louisiana	LA
19	Maine	ME
20	Montana	MT
21	Nebraska	NE
22	Nevada	NV
23	New Hampshire	NH
24	New Jersey	NJ
25	New Mexico	NM
26	New York	NY
27	North Carolina	NC
28	North Dakota	ND
29	Ohio	OH
30	Oklahoma	OK
31	Oregon	OR
32	Maryland	MD
33	Massachusetts	MA
34	Michigan	MI
35	Minnesota	MN
36	Mississippi	MS
37	Missouri	MO
38	Pennsylvania	PA
39	Rhode Island	RI
40	South Carolina	SC
41	South Dakota	SD
42	Tennessee	TN
43