分析美帝的投票

最新推荐文章于 2024-08-15 01:55:01 发布

青灯有味是儿时

最新推荐文章于 2024-08-15 01:55:01 发布

阅读量112

点赞数

文章标签： python

本文链接：https://blog.csdn.net/weixin_45797937/article/details/124678143

版权

import numpy as np
import pandas as pd
path=r"C:\Users\Tsinghua-yincheng\Desktop\SZday74"

pop=pd.read_csv(path+"\\"+"state-population.csv")
areas=pd.read_csv(path+"\\"+"state-areas.csv")
abbrevs=pd.read_csv(path+"\\"+"state-abbrevs.csv")
pop.head(5)

在这里插入图片描述

areas.head(5)

在这里插入图片描述

abbrevs.head(5)

在这里插入图片描述

display(pop.shape,areas.shape,abbrevs.shape)

在这里插入图片描述

merged=pd.merge(pop,abbrevs,how="outer",
                left_on="state/region",
                right_on="abbreviation") #归并
merged

在这里插入图片描述

merged=merged.drop("abbreviation",axis=1) #删除重复的abbreviation
merged

在这里插入图片描述

merged.isnull().any()

在这里插入图片描述

merged[merged["population"].isnull()]#查看残缺数据

在这里插入图片描述

merged.loc[merged["state"].isnull(),"state/region"] 
#查看state为空的时候，state/region的字段数据

在这里插入图片描述

merged.loc[merged["state"].isnull(),"state/region"].unique()

在这里插入图片描述

merged.loc[merged["state/region"]=="PR","state"]="Puerto Rico"
merged.loc[merged["state/region"]=="USA","state"]=\
    "United States"
merged.isnull().any()  #处理了缺失数据，

在这里插入图片描述

merged

在这里插入图片描述

final=pd.merge(merged,areas,on="state",how="left") #归并，加入面积
final

在这里插入图片描述

final.shape

在这里插入图片描述

final.isnull().any()

在这里插入图片描述

final["state"][final["area (sq. mi)"].isnull()]

在这里插入图片描述

final["state"][final["area (sq. mi)"].isnull()].unique() #去掉重复

在这里插入图片描述

final.dropna(inplace=True) #删除空缺US
final

在这里插入图片描述

final.isnull().any() #都不为空

在这里插入图片描述

final

在这里插入图片描述

data2010=final.query("year==2010  & ages=='total'")
data2010

在这里插入图片描述

data2010.shape

在这里插入图片描述

data2010.set_index("state",inplace=True) #重置索引
data2010

在这里插入图片描述

#计算人口密度
density=data2010["population"].div(data2010["area (sq. mi)"])
density

在这里插入图片描述

density.sort_values(ascending=False,inplace=True) 
#排序  ascending=False降序  ，inplace=True本地排序替换density
density.head(10)

在这里插入图片描述

density.tail(10)

在这里插入图片描述

青灯有味是儿时

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
分析美帝的投票

import numpy as npimport pandas as pdpath=r"C:\Users\Tsinghua-yincheng\Desktop\SZday74"pop=pd.read_csv(path+"\\"+"state-population.csv")areas=pd.read_csv(path+"\\"+"state-areas.csv")abbrevs=pd.read_csv(path+"\\"+"state-abbrevs.csv")pop.head(5)are
复制链接

扫一扫