数据集:
Id:1-524288的递增数列
Name:20652个不重复的名字
Year:1910-2014
Gender:男、女
State:共10个
AK-Alaska
AL-Alabama
AR-Arkansas
AZ-Arizona
CA-California
CO-Colorado
CT-Connecticut
DC-Washington
DE-Delaware
FL-Florida
Count:某性别在某年取某个姓名的婴儿人数
自命题一:取出1981年华盛顿州被命名人数最多的前五个男婴名字,并画出柱状图
思路:
1、按照DataFrame类型读入源文件
2、删除与默认索引重复的Id列
3、取出1981年出生的全部婴儿记录
4、在3的返回结果中取出华盛顿州婴儿记录
5、在4的返回结果集中取出男婴记录
6、在5的返回结果集中按照Count字段降序排序
7、在6的结果集中取出前5位
结果集如下:
绘图如下:
注意点:
1)Series、list、range等数据类型的区别,哪些可以用于bar()函数的参数。
2)使用matplotlib画图时一些常用参数的设置方法。