对美国新生儿取名的几个数据分析自命题(一)

数据集:
Id:1-524288的递增数列
Name:20652个不重复的名字
Year:1910-2014
Gender:男、女
State:共10个
AK-Alaska
AL-Alabama
AR-Arkansas
AZ-Arizona
CA-California
CO-Colorado
CT-Connecticut
DC-Washington
DE-Delaware
FL-Florida
Count:某性别在某年取某个姓名的婴儿人数

自命题一:取出1981年华盛顿州被命名人数最多的前五个男婴名字,并画出柱状图

思路:
1、按照DataFrame类型读入源文件
2、删除与默认索引重复的Id列
3、取出1981年出生的全部婴儿记录
4、在3的返回结果中取出华盛顿州婴儿记录
5、在4的返回结果集中取出男婴记录
6、在5的返回结果集中按照Count字段降序排序
7、在6的结果集中取出前5位

结果集如下:
在这里插入图片描述绘图如下:
在这里插入图片描述

注意点:
1)Series、list、range等数据类型的区别,哪些可以用于bar()函数的参数。
2)使用matplotlib画图时一些常用参数的设置方法。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值