数据来源网络 美国各州人口分析
首先。导入所需模块
import pandas as pd
from pandas import DataFrame,Series
将数据文件导入 abb 为州名及简写 area 各州面积 pop 人口信息
abb = pd.read_csv('./data/state-abbrevs.csv')
area = pd.read_csv('./data/state-areas.csv')
pop = pd.read_csv('./data/state-population.csv')
查看数据大小
display(abb.shape,area.shape,pop.shape)
数据样式
display(abb.head(),area.head(),pop.head())
显示结果如下
现将三张dataframe 合并
首先是abb area
abb_area = pd.merge(abb,area,how='outer')
how='outer’表示保留两张表不同信息。可能出现空值。要处理空值。
abb_area.isnull().sum()
</