数据分析——人口变化matplotilb绘图

1 篇文章 0 订阅
1 篇文章 0 订阅

实验要求

通过可视化可以直观看出人口从1996年到2015年的变化情况,分析我国人口结构变化情况以及变化速率的增减状况。

正文

在数据分析实验中,要求使用matplotlib库,分析作图,可视化数据来帮助我们分析人口变化情况。

首先查看了所给数据后,因为要分析人口结构,首先想到得是男女人口变化情况和城乡人口变化情况,为了更好得看出不同群体得人口数量变化和结构变化,在统计显示人口时,使用直方图同时绘制男性人口数量和女性人口数量。如下:
男女人口数量直方图

想要直观看出比例的,用饼状图是一个不错的选择
饼状图
主要用到的函数:

  1. 直方图
plt.bar(range(2), values[19, 2:4], width=0.5, color='red')
#原函数定义
bar(x, height, width=0.8, bottom=None, ***, align='center', data=None, **kwargs)
  • x: x坐标
  • height:条形的高度
  • width:宽度
  • color:颜色
  1. 饼状图
plt.pie(values[19, 2:4], explode=ex, labels=label1, colors=['pink', 'crimson'], autopct='%1.1f%%')
plt.title('1996年男、女人口数饼图')
  • x:每一块饼图的比例,为必填项,如果sum(x)>1,会将多出的部分进行均分(也就是对应的value 数据部分)
  • labels : 每一块饼图外侧显示的说明文字
  • explode : 每一块饼图 离开中心距离,默认值为(0,0),就是不离开中心
  • colors:数组,可选参数,默认为:None;用来标注每块饼图的matplotlib颜色参数序列。如果为None,将使用当前活动环的颜色。
  1. 箱线图
plt.boxplot(values[0:20, 1:6], notch=True, labels=['年末', '男性', '女性', '城镇', '乡村'], meanline=True)
  • x, 指定要绘制箱线图的数据;
  • meanline=None, # 是否用线的形式表示均值,默认用点来表示;
  • labels=None, # 为箱线图添加标签,类似于图例的作用;
  • notch=None, # 是否是凹口的形式展现箱线图,默认非凹口;

完整代码如下:

import matplotlib
import numpy as np
import matplotlib.pyplot as plt

matplotlib.rcParams['font.sans-serif'] = ['SimHei']
data_load = np.load('data/exp1/populations.npz', allow_pickle=True)
feature = data_load["feature_names"]
values = data_load["data"]

plt.rcParams['font.sans-serif'] = 'SimHei'  # 设置中文显示
label1 = ['男性', '女性']  # 标签
label2 = ['城镇', '乡村']
ex = [0.01, 0.01]  # 饼图:设定各项距离圆心n个半径

# 1.直方图
p1 = plt.figure(figsize=(24, 8))  # 设置画布大小
# 子图1
a1 = p1.add_subplot(1, 3, 1)
plt.bar(range(2), values[19, 2:4], width=0.5, color='red')
plt.ylabel('人口(万人)')
plt.ylim(0, 80000)  # 设置当前图形y轴的范围
plt.xticks(range(2), label1)  # 指定x轴刻度的数目与取值
plt.title('1996年男、女人口数直方图')

# 子图2
b1 = p1.add_subplot(1, 3, 2)
plt.bar(range(2), values[9, 2:4], width=0.5, color='orange')
plt.ylabel('人口(万人)')
plt.ylim(0, 80000)
plt.xticks(range(2), label1)
plt.title('2005年男、女人口数直方图')
# 子图3
c1 = p1.add_subplot(1, 3, 3)
plt.bar(range(2), values[0, 2:4], width=0.5, color='red')
plt.ylabel('人口(万人)')
plt.ylim(0, 80000)
plt.xticks(range(2), label1)
plt.title('2015年男、女人口数直方图')
plt.savefig('1996、2005、2015男女人口数直方图')
# 子图1
p11 = plt.figure(figsize=(24, 8))  # 设置画布大小
d1 = p11.add_subplot(1, 3, 1)
plt.bar(range(2), values[19, 4:6], width=0.5, color='orange')
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.ylim(0, 90000)
plt.xticks(range(2), label2)
plt.title('1996年城、乡人口数直方图')

# 子图2
e1 = p11.add_subplot(1, 3, 2)
plt.bar(range(2), values[9, 4:6], width=0.5, color='red')
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.ylim(0, 90000)
plt.xticks(range(2), label2)
plt.title('2005年城、乡人口数直方图')

# 子图3
f1 = p11.add_subplot(1, 3, 3)
plt.bar(range(2), values[0, 4:6], width=0.5, color='orange')
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.ylim(0, 90000)
plt.xticks(range(2), label2)
plt.title('2015年城、乡人口数直方图')
plt.savefig('1996、2005、2015年城乡人口直方图.png')  # 保存图片

# 2.饼图
p2 = plt.figure(figsize=(12, 8))
# 子图1
a2 = p2.add_subplot(2, 3, 1)
plt.pie(values[19, 2:4], explode=ex, labels=label1, colors=['pink', 'crimson'], autopct='%1.1f%%')
plt.title('1996年男、女人口数饼图')

# 子图2
b2 = p2.add_subplot(2, 3, 2)
plt.pie(values[9, 2:4], explode=ex, labels=label1, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2005年男、女人口数饼图')
# 子图3
c2 = p2.add_subplot(2, 3, 3)
plt.pie(values[0, 2:4], explode=ex, labels=label1, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2015年男、女人口数饼图')

# 子图4
d2 = p2.add_subplot(2, 3, 4)
plt.pie(values[19, 4:6], explode=ex, labels=label2, colors=['pink', 'crimson'], autopct='%1.1f%%')
plt.title('1996年城、乡人口数饼图')

# 子图5
e2 = p2.add_subplot(2, 3, 5)
plt.pie(values[9, 4:6], explode=ex, labels=label2, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2005年城、乡人口数饼图')

# 子图6
f2 = p2.add_subplot(2, 3, 6)
plt.pie(values[0, 4:6], explode=ex, labels=label2, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2015年城、乡人口数饼图')
plt.savefig('1996、2005、2015年各类人口饼图.png')

# 3.箱线图
p3 = plt.figure(figsize=(10, 10))
plt.boxplot(values[0:20, 1:6], notch=True, labels=['年末', '男性', '女性', '城镇', '乡村'], meanline=True)
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.title('1996~2015年各特征人口箱线图')
plt.savefig('1996`2015年各特征人口箱线图.png')

# 显示
plt.show()

附录:
实验数据:
第三章
链接:https://pan.baidu.com/s/1n-GT4kZsV7vKEULCge2QUQ?pwd=fghl

  • 2
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

magicwindyyd

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值