实训1 分析1996-2015年人口数据特征间的特征
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]="SimHei"
plt.rcParams["axes.unicode_minus"]=False
t=np.load('G:/大数据实验数据库/1.78P实训/populations.npz',allow_pickle=True)
name=t["data"]
values=t["feature_names"]
yearlist=[]
for i in t["data"][0:20:,0]:
yearlist.append(int(i[0:len(i)-1]))
p1=plt.figure(figsize=(20,18),dpi=80)
ax1=p1.add_subplot(2,2,1)
plt.xlim((1996,2016))
plt.xticks(yearlist,t["data"][0:20:,0],rotation=45)
plt.title("1996-2015年人口变化的散点图",size=30)
plt.xlabel("时间",size=25)
plt.ylabel("人口数量",size=25)
plt.scatter(yearlist,t["data"][0:20:,1])
plt.scatter(yearlist,t["data"][0:20:,2])
plt.scatter(yearlist,t["data"][0:20:,3])
plt.scatter(yearlist,t["data"][0:20:,4])
plt.scatter(yearlist,t["data"][0:20:,5])
plt.legend(["年末人口数","男性人口","女性人口","城镇人口","农村人口"])
ax2=p1.add_subplot(2,2,2)
plt.xlim((1996,2016))
plt.xticks(yearlist,t["data"][0:20:,0],rotation=45)
plt.title("1996-2015年人口变化的折线图",size=30)
plt.xlabel("时间",size=25)
plt.ylabel("人口数量",size=25)
plt.plot(yearlist,t["data"][0:20:,1],color="r",linestyle="--")
plt.plot(yearlist,t["data"][0:20:,2],color="g",linestyle="--")
plt.plot(yearlist,t["data"][0:20:,3],color="b",linestyle="--")
plt.plot(yearlist,t["data"][0:20:,4],color="c",linestyle="--")
plt.plot(yearlist,t["data"][0:20:,5],color="y",linestyle="--")
plt.legend(["年末人口数","男性人口","女性人口","城镇人口","农村人口"])
plt.show()
实训2 分析1996-2015年人口数据各个特征的分布与分散状况
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]="SimHei"
plt.rcParams["axes.unicode_minus"]=False
data=np.load('G:/大数据实验数据库/1.78P实训/populations.npz',allow_pickle=True)
def getKeys(data):
ks=[]
for i in data.keys():
ks.append(i)
return ks
keys = getKeys(data)
values = data[keys[0]][-3::-1,:]
name=data['feature_names']
p = plt.figure(figsize=(15,20))
label=['男性人口','女性人口','城镇人口','乡村人口']
explode=[0.01,0.01,0.01,0.01]
gdp=(list(values[:,2]),list(values[:,3]),list(values[:,4]),list(values[:,5]))
ax1 =p.add_subplot(3,1,1)
plt.title('1996-2015年人口数据特征间的关系直方图')
plt.xlabel('类别')
plt.ylabel('人口数(万人)')
plt.bar(range(4),values[0,2:6],width=0.5)
plt.xticks(range(4),label)
ax2 = p.add_subplot(3,1,2)
plt.title('1996-2015年人口数据特征间的关系饼图')
plt.pie(values[0,2:6],explode=explode,labels=label,autopct='%1.1f%%')
ax3 = p.add_subplot(3,1,3)
plt.title('1996-2015年人口数据特征间的关系箱线图')
plt.boxplot(gdp,notch=True,labels=label,meanline=True)
plt.show()