Python数据可视化基础

一、项目名称

Python数据可视化基础

二、项目目标

掌握7种Python数据可视化库的基本绘图方法,能够根据项目要求,选择合适的图形、设置参数和绘制图形。

三、项目具体任务

1、文件“employee.csv”中包含3个产业就业人员数据,请分析各产业就业人员数据特征间的关系以及各产业就业人员数据特征的分布与分散状况。

(1)使用Matplotlib绘制2000-2019年各产业就业人员散点图。

(2)使用Holoviews绘制2000-2019年各产业就业人员折线图。

(3)使用Plotly绘制2019年各产业就业人员饼图。

(4)使用Pyecharts绘制2019年各产业就业人员柱状图。

(5)使用Seaborn绘制2000-2019年各产业就业人员年末总人数箱线图。

四、学生知识和能力要求

1、网络检索能力;

2、下载并安装软件。

五、工具与设备

1、操作系统:Windows 10

2、软件:anaconda、jupyter notebook

六、实施步骤与技术要点

1、导入相应的Python数据可视化库;

2、设置中文显示;

3、利用pandas读取数据文件,获取相关数据;

4、创建画布,设置参数,如添加标题、图例、坐标轴、刻度等。

5、绘制相应的图形并进行美化。

(1)使用Matplotlib绘制2000-2019年各产业就业人员散点图。
# 绘制2000-2019个产业就业人员散点图
# 解决标签中文乱码
plt.rcParams['font.sans-serif'] = ['SimHei']
# 调整画布尺寸
plt.figure(figsize=(12, 5))
# 第一产业就业人员(万人)
plt.scatter(data[data.columns[0]], data[data.columns[2]], color='red', label='第一产业')
# 第二产业就业人员(万人)
plt.scatter(data[data.columns[0]], data[data.columns[3]], color='blue', label='第二产业')
# # 第三产业就业人员(万人)
plt.scatter(data[data.columns[0]], data[data.columns[4]], color='black', label='第三产业')
# 设置x轴标签
plt.xlabel('年份')
# 设置y轴标签
plt.ylabel('就业人数(百万)')
# 显示图例
plt.legend()
plt.title('2000-2019个产业就业人员散点图')
# 显示散点图
(2)使用Holoviews绘制2000-2019年各产业就业人员折线图。
# 调整画布尺寸
plt.figure(figsize=(12, 5))
# 第一产业就业人员(万人)
plt.plot(data[data.columns[0]], data[data.columns[2]], color='r', label='第一产业')
# 第二产业就业人员(万人)
plt.plot(data[data.columns[0]], data[data.columns[3]], color='b', label='第二产业')
# 第三产业就业人员(万人)
plt.plot(data[data.columns[0]], data[data.columns[4]], color='k', label='第三产业')
# 设置x轴标签
plt.xlabel('年份')
# 设置y轴标签
plt.ylabel('就业人数(百万)')
# 显示图例
plt.legend()
# 显示标题
plt.title('2000-2019个产业就业人员折线图')
# 显示折线图
plt.show()

(3)使用Plotly绘制2019年各产业就业人员饼图。
# [-1][2:] 表示最后一行数据(即2019年)的第一、二、三产业数据
plt.pie(data.values[-1][2:], labels=['第一产业', '第二产业', '第三产业'], autopct="%1.1f%%", startangle=90)
# 显示标题
plt.title('2019年各产业就业人员饼图')
# 显示饼图
plt.show()

(4)使用Pyecharts绘制2019年各产业就业人员柱状图。
# 调整画布尺寸
plt.figure(figsize=(12, 5))
# [-1][2:] 表示最后一行数据(即2019年)的第一、二、三产业数据
plt.bar(data.columns[2:], data.values[-1][2:])
# 在柱子顶部显示数值
for a, b in zip(data.columns[2:], data.values[-1][2:]):
    plt.text(a, b, b)
# 显示标题
plt.title('2019年各产业就业人员柱形图')
# 显示饼图

(5)绘制2000-2019年各产业就业人员年末总人数箱线图。
# 绘制2000—2019年各产业就业人员年末总人数箱线图
plt.boxplot([data[data.columns[2]], data[data.columns[3]], data[data.columns[4]]], labels=data.columns[2:])
# 显示标题
plt.title("2000—2019年各产业就业人员年末总人数箱线图")
# 显示图表
plt.show()

  • 27
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

帅小溪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值