实验要求
通过可视化可以直观看出人口从1996年到2015年的变化情况,分析我国人口结构变化情况以及变化速率的增减状况。
正文
在数据分析实验中,要求使用matplotlib库,分析作图,可视化数据来帮助我们分析人口变化情况。
首先查看了所给数据后,因为要分析人口结构,首先想到得是男女人口变化情况和城乡人口变化情况,为了更好得看出不同群体得人口数量变化和结构变化,在统计显示人口时,使用直方图同时绘制男性人口数量和女性人口数量。如下:
想要直观看出比例的,用饼状图是一个不错的选择
主要用到的函数:
- 直方图
plt.bar(range(2), values[19, 2:4], width=0.5, color='red')
#原函数定义
bar(x, height, width=0.8, bottom=None, ***, align='center', data=None, **kwargs)
- x: x坐标
- height:条形的高度
- width:宽度
- color:颜色
- 饼状图
plt.pie(values[19, 2:4], explode=ex, labels=label1, colors=['pink', 'crimson'], autopct='%1.1f%%')
plt.title('1996年男、女人口数饼图')
- x:每一块饼图的比例,为必填项,如果sum(x)>1,会将多出的部分进行均分(也就是对应的value 数据部分)
- labels : 每一块饼图外侧显示的说明文字
- explode : 每一块饼图 离开中心距离,默认值为(0,0),就是不离开中心
- colors:数组,可选参数,默认为:None;用来标注每块饼图的matplotlib颜色参数序列。如果为None,将使用当前活动环的颜色。
- 箱线图
plt.boxplot(values[0:20, 1:6], notch=True, labels=['年末', '男性', '女性', '城镇', '乡村'], meanline=True)
- x, 指定要绘制箱线图的数据;
- meanline=None, # 是否用线的形式表示均值,默认用点来表示;
- labels=None, # 为箱线图添加标签,类似于图例的作用;
- notch=None, # 是否是凹口的形式展现箱线图,默认非凹口;
完整代码如下:
import matplotlib
import numpy as np
import matplotlib.pyplot as plt
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
data_load = np.load('data/exp1/populations.npz', allow_pickle=True)
feature = data_load["feature_names"]
values = data_load["data"]
plt.rcParams['font.sans-serif'] = 'SimHei' # 设置中文显示
label1 = ['男性', '女性'] # 标签
label2 = ['城镇', '乡村']
ex = [0.01, 0.01] # 饼图:设定各项距离圆心n个半径
# 1.直方图
p1 = plt.figure(figsize=(24, 8)) # 设置画布大小
# 子图1
a1 = p1.add_subplot(1, 3, 1)
plt.bar(range(2), values[19, 2:4], width=0.5, color='red')
plt.ylabel('人口(万人)')
plt.ylim(0, 80000) # 设置当前图形y轴的范围
plt.xticks(range(2), label1) # 指定x轴刻度的数目与取值
plt.title('1996年男、女人口数直方图')
# 子图2
b1 = p1.add_subplot(1, 3, 2)
plt.bar(range(2), values[9, 2:4], width=0.5, color='orange')
plt.ylabel('人口(万人)')
plt.ylim(0, 80000)
plt.xticks(range(2), label1)
plt.title('2005年男、女人口数直方图')
# 子图3
c1 = p1.add_subplot(1, 3, 3)
plt.bar(range(2), values[0, 2:4], width=0.5, color='red')
plt.ylabel('人口(万人)')
plt.ylim(0, 80000)
plt.xticks(range(2), label1)
plt.title('2015年男、女人口数直方图')
plt.savefig('1996、2005、2015男女人口数直方图')
# 子图1
p11 = plt.figure(figsize=(24, 8)) # 设置画布大小
d1 = p11.add_subplot(1, 3, 1)
plt.bar(range(2), values[19, 4:6], width=0.5, color='orange')
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.ylim(0, 90000)
plt.xticks(range(2), label2)
plt.title('1996年城、乡人口数直方图')
# 子图2
e1 = p11.add_subplot(1, 3, 2)
plt.bar(range(2), values[9, 4:6], width=0.5, color='red')
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.ylim(0, 90000)
plt.xticks(range(2), label2)
plt.title('2005年城、乡人口数直方图')
# 子图3
f1 = p11.add_subplot(1, 3, 3)
plt.bar(range(2), values[0, 4:6], width=0.5, color='orange')
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.ylim(0, 90000)
plt.xticks(range(2), label2)
plt.title('2015年城、乡人口数直方图')
plt.savefig('1996、2005、2015年城乡人口直方图.png') # 保存图片
# 2.饼图
p2 = plt.figure(figsize=(12, 8))
# 子图1
a2 = p2.add_subplot(2, 3, 1)
plt.pie(values[19, 2:4], explode=ex, labels=label1, colors=['pink', 'crimson'], autopct='%1.1f%%')
plt.title('1996年男、女人口数饼图')
# 子图2
b2 = p2.add_subplot(2, 3, 2)
plt.pie(values[9, 2:4], explode=ex, labels=label1, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2005年男、女人口数饼图')
# 子图3
c2 = p2.add_subplot(2, 3, 3)
plt.pie(values[0, 2:4], explode=ex, labels=label1, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2015年男、女人口数饼图')
# 子图4
d2 = p2.add_subplot(2, 3, 4)
plt.pie(values[19, 4:6], explode=ex, labels=label2, colors=['pink', 'crimson'], autopct='%1.1f%%')
plt.title('1996年城、乡人口数饼图')
# 子图5
e2 = p2.add_subplot(2, 3, 5)
plt.pie(values[9, 4:6], explode=ex, labels=label2, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2005年城、乡人口数饼图')
# 子图6
f2 = p2.add_subplot(2, 3, 6)
plt.pie(values[0, 4:6], explode=ex, labels=label2, colors=['PeachPuff', 'skyblue'], autopct='%1.1f%%')
plt.title('2015年城、乡人口数饼图')
plt.savefig('1996、2005、2015年各类人口饼图.png')
# 3.箱线图
p3 = plt.figure(figsize=(10, 10))
plt.boxplot(values[0:20, 1:6], notch=True, labels=['年末', '男性', '女性', '城镇', '乡村'], meanline=True)
plt.xlabel('类别')
plt.ylabel('人口(万人)')
plt.title('1996~2015年各特征人口箱线图')
plt.savefig('1996`2015年各特征人口箱线图.png')
# 显示
plt.show()
附录:
实验数据:
第三章
链接:https://pan.baidu.com/s/1n-GT4kZsV7vKEULCge2QUQ?pwd=fghl