Python数据分析及可视化-小测验

本文中测验需要的文件夹下载链接: https://pan.baidu.com/s/1OqFM2TNY75iOST6fBlm6jw 密码: rmbt
下载压缩包后解压如下图所示:

10345471-21244e0e3c640e87.png
image.png

首先将5题的文件复制形成副本,如下图所示:
10345471-cc9c7e11259a9c6c.png
image.png

在资源管理器的路径中输入cmd,如下图所示:
10345471-16ccd2c098b08461.png
image.png

在上图中输入后,按Enter键运行进入cmd窗口。
在cmd窗口中输入并运行命令: jupyter notebook,如下图所示:
10345471-67bd57031ac93c57.png
image.png

在上图中输入后,按Enter键运行自动打开浏览器并且进入jupyter notebook编程界面。
在jupyter notebook中,点击 第一题,ipynb第一题-副本.ipynb
浏览器会新建两个标签页,如下图所示:
10345471-4ae2328880b24ac7.png
image.png

在两个标签页中,读者可以对照题目要求完成做题。
下面是5道题目作者的答案和解析。

1.第一大题

1.1 第一步:导入相应的模块

最后2行代码可以使作图时不出现编码错误,分别用来正常显示中文标签和正常显示负号。

import pandas as pd
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号

1.2 第二步:利用pandas读取datasets目录下chipo.csv并显示前十行数据(赋值给变量chipo)

csv文件默认的分隔符是逗号,pd.read_csv方法中sep关键字参数的默认值也为逗号,所以可以不写sep关键字。
显示前十行数据用chipo.head(10)即可。

chipo = pd.read_csv('datasets/chipo.csv')
chipo.head(10)

1.3 第三步:根据列名为item_name中每种商品出现的频率,绘制出柱状图

给出的答案示例是购买次数排名第2-6名的商品的作图结果。
chipo.item_name.value_counts()是对商品购买次数进行统计,返回的结果降序排列,数据类型为Series。
plt.xticks()方法中可以填入1个参数或者多个参数,下面代码中采用的是填入3个参数。
x_list是x轴标记点,数据类型为列表;xticks_list是x轴标记点显示值,数据类型为列表;
rotation设置为90,是x轴标记点显示值以右边为轴逆时针旋转90度。
plt.bar方法中指定每根柱子的颜色,这样才可以画出示例答案的效果。

mostOrder_list = chipo.item_name.value_counts().iloc[5:0:-1]
xticks_list = mostOrder_lis
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值