数据来源:https://pan.baidu.com/s/1MUqs391emlIUsf_wyX2GAg#list/path=%2F
密码:utbp
第一部分 按性别/年份统计出生数
思路:加载所有txt文件并进行整合,创建数据透视表,运用DataFrame内置绘图
step1
import pandas as pd
years=range(1880, 2011)
babynames = []
#建立列表,以存放多个DataFrame
for year in years:
frame = pd.read_csv(r'C:UsersAdministratorDownloadspydata-book-2nd-editiondatasetsbabynamesyob%d.txt'% year, names=['name','gender','births'])
frame['year'] = year
#新增year列
babynames.append(frame)
names = pd.concat(babynames, ignore_index=True)
#去除原DataFrame中的索引
step2
table=names.pivot_table('births',index='year',columns='gender',aggfunc='sum')
#需要指定具体对象——names,创建按性别/年度统计的出生数
table.head()
ge