前面系列文章讲过数据挖掘的各种知识,最近在研究人类时空动力学分析和幂率定律,发现在人类兴趣转移模型中,可以通过热图(斑图)来进行描述的兴趣转移,如下图所示。下一篇文章将简单普及人类动力学相关知识研究。
这篇文章结合Matplotlib的imshow()函数,讲述热图(斑图)绘制及相关参数基础知识。希望文章对你有所帮助,如果文章中存在错误或不足之处,还请海涵。
前文推荐:
【Python数据挖掘课程】一.安装Python及爬虫入门介绍
【Python数据挖掘课程】二.Kmeans聚类数据分析及Anaconda介绍
【Python数据挖掘课程】三.Kmeans聚类代码实现、作业及优化
【Python数据挖掘课程】四.决策树DTC数据分析及鸢尾数据集分析
【Python数据挖掘课程】五.线性回归知识及预测糖尿病实例
【Python数据挖掘课程】六.Numpy、Pandas和Matplotlib包基础知识
【Python数据挖掘课程】七.PCA降维操作及subplot子图绘制
【Python数据挖掘课程】八.关联规则挖掘及Apriori实现购物推荐
【Python数据挖掘课程】九.回归模型LinearRegression简单分析氧化物数据
【python数据挖掘课程】十.Pandas、Matplotlib、PCA绘图实用代码补充
【python数据挖掘课程】十一.Pandas、Matplotlib结合SQL语句可视化分析
【python数据挖掘课程】十二.Pandas、Matplotlib结合SQL语句对比图分析
【python数据挖掘课程】十三.WordCloud词云配置过程及词频分析
【python数据挖掘课程】十四.Scipy调用curve_fit实现曲线拟合
一. Matplotlib简单回顾
Matplotlib是Python最著名的2D绘图库,该库仿造Matlab提供了一整套相似的绘图函数,用于绘图和绘表,强大的数据可视化工具和做图库,适合交互式绘图,图形美观。
首先,通过一段代码给大家回顾下Matplotlib绘图知识。绘制2*3共6个子图,且图为空的代码如下:
# coding=utf-8
from matplotlib import pyplot as plt
fig = plt.figure()
ax1 = fig.add_subplot(231)
ax2 = fig.add_subplot(232)
ax3 = fig.add_subplot(233)
ax4 = fig.add_subplot(234)
ax5 = fig.add_subplot(235)
ax6 = fig.add_subplot(236)
plt.grid(True)
plt.show()
运行结果如下图所示:
然后需要调用函数绘图,下面提几个重点知识:
1.plot(x, y, marker='D')表示绘制折线图,marker设置样式菱形。
2.scatter(x, y, marker='s', color='r')绘制散点图,红色正方形。
3.bar(x, y, 0.5, color='c')绘制柱状图,间距为0.5,原色。
4.hist(data,40,normed=1,histtype='bar',
facecolor='yellowgreen',alpha=0.75)直方图。
5.设置x轴和y轴的坐标值:
xlim(-2.5, 2.5) #设置x轴范围 ylim(-1, 1) #设置y轴范围
6.显示中文和负号代码如下:
plt.rcParams['font.sas-serig']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
完整代码如下:
# coding=utf-8
import numpy as np
from pylab import *
from matplotlib import pyplot as plt
x = [1, 2, 3, 4]
y = [3, 5, 10, 25]
#创建Figure
fig = plt.figure()
#创建一个或多个子图(subplot绘图区才能绘图)
ax1 = fig.add_subplot(231)
plt.plot(x, y, marker='D') #绘图及选择子图
plt.sca(ax1)
ax2 = fig.add_subplot(232)
plt.scatter(x, y, marker='s', color='r')
plt.sca(ax2)
plt.grid(True)
ax3 = fig.add_subplot(233)
plt.bar(x, y, 0.5, color='c') #柱状图 width=0.5间距
plt.sca(ax3)
ax4 = fig.add_subplot(234)
#高斯分布
mean = 0 #均值为0
sigma = 1 #标准差为1 (反应数据集中还是分散的值)
data = mean+sigma*np.random.randn(10000)
plt.hist(data,40,normed=1,histtype='bar',facecolor='yellowgreen',alpha=0.75)
plt.sca(ax4)
m = np.arange(-5.0, 5.0, 0.02)
n = np.sin(m)
ax5 = fig.add_subplot(235)
plt.plot(m, n)
plt.sca(ax5)
ax6 = fig.add_subplot(236)
xlim(-2.5, 2.5) #设置x轴范围
ylim(-1, 1) #设置y轴范围
plt.plot(m, n)
plt.sca(ax6)
plt.grid(True)
plt.show()
输出结果如下图所示:
Matplotlib强推博客:
http://www.cnblogs.com/zhizhan/p/5615947.html
http://blog.csdn.net/jinlong_xu/article/details/70183377
【Python数据挖掘课程】六.Numpy、Pandas和Matplotlib包基础知识
二. imshow详解热图知识
热图(heatmap)是数据分析的常用方法,通过色差、亮度来展示数据的差异、易于理解。Python在Matplotlib库中,调用imshow()函数实现热图绘制。
参考资料:http://matplotlib.org/users/image_tutorial.html
源码介绍如下图所示:
imshow(X, cmap=None, norm=None, aspect=None, interpolation=None, alpha=None, vmin=None, vmax=None, origin=None, extent=None, shape=None, filternorm=1, filterrad=4.0, imlim=None, resample=None, url=None, hold=None, data=None, **kwargs)
其中,X变量存储图像,可以是浮点型数组、unit8数组以及PIL图像,如果其为数组,则需满足一下形状:
(1) M*N 此时数组必须为浮点型,其中值为该坐标的灰度;
(2) M*N*3 RGB(浮点型或者unit8类型)
(3) M*N*4 RGBA(浮点型或者unit8类型)
下面这段代码是一个简单的实例:
# coding=utf-8
from matplotlib import pyplot as plt
X = [[1,2],[3,4],[5,6]]
plt.imshow(X)
plt.show()
输出如下图所示:
Colorbar:增加颜色类标的代码是plt.colorbar(),代码如下:
#coding=utf-8
from matplotlib import pyplot as plt
X = [[1,2],[3,4],[5,6]]
plt.imshow(X)
plt.colorbar()
plt.show()
运行结果如下图所示,其中左上角颜色为蓝色,对应值为1;右下角颜色为深红色,对应值为6。它是按照矩阵X进行颜色分布的。
[1, 2] [深蓝, 浅蓝]
[3, 4] [淡绿, 黄色]
[5, 6] [橙红, 深红]
plt.colorbar(cax=None,ax=None,shrink=0.5)可设置Bar为一半长度。
Colormap:参数cmap用于设置热图的Colormap。(参考百度百科)
Colormap是MATLAB里面用来设定和获取当前色图的函数,可以设置如下色图:
hot 从黑平滑过度到红、橙色和黄色的背景色,然后到白色。
cool 包含青绿色和品红色的阴影色。从青绿色平滑变化到品红色。
gray 返回线性灰度色图。
bone 具有较高的蓝色成分的灰度色图。该色图用于对灰度图添加电子的视图。
white 全白的单色色图。
spring 包含品红和黄的阴影颜色。
summer 包含绿和黄的阴影颜色。
autumn 从红色平滑变化到橙色,然后到黄色。
winter 包含蓝和绿的阴影色。
下面这段代码是显示原图、灰度(gray)、和春夏秋冬的示例。
#coding=utf-8
from matplotlib import pyplot as plt
X = [[1,2],[3,4]]
fig = plt.figure()
ax = fig.add_subplot(231)
ax.imshow(X)
ax = fig.add_subplot(232)
ax.imshow(X, cmap=plt.cm.gray) #灰度
ax = fig.add_subplot(233)
im = ax.imshow(X, cmap=plt.cm.spring) #春
plt.colorbar(im)
ax = fig.add_subplot(234)
im = ax.imshow(X, cmap=plt.cm.summer)
plt.colorbar(im, cax=None, ax=None, shrink=0.5) #长度为半
ax = fig.add_subplot(235)
im = ax.imshow(X, cmap=plt.cm.autumn)
plt.colorbar(im, shrink=0.5, ticks=[-1,0,1])
ax = fig.add_subplot(236)
im = ax.imshow(X, cmap=plt.cm.winter)
plt.colorbar(im, shrink=0.5)
plt.show()
运行结果如下图所示:
通常图片都是由RGB组成,一块一块的,详见我的数字图像处理系列博客,这里想把某块显示成一种颜色,则需要调用interpolation='nearest'参数即可,代码如下:
#coding=utf-8
from matplotlib import pyplot as plt
X = [[0, 0.25], [0.5, 0.75]]
fig = plt.figure()
ax = fig.add_subplot(121)
im = ax.imshow(X, cmap=plt.get_cmap('hot'))
plt.colorbar(im, shrink=0.5)
ax = fig.add_subplot(122)
im = ax.imshow(X, cmap=plt.get_cmap('hot'), interpolation='nearest',
vmin=0, vmax=1)
plt.colorbar(im, shrink=0.2)
plt.show()
运行结果如下图所示:
推荐文章:matplotlib imshow - default colour normalisation
默认情况下,imshow将数据标准化为最小和最大值。 您可以使用vmin和vmax参数或norm参数来控制(如果您想要非线性缩放)。
百度经验提供一段代码,也不错,推荐大家学习。
注意:相当于在A~J和a~j的图像矩阵中,产生10*10的随机数,对矩阵进行颜色填充;只是在填充过程中,选择随机数的最大值和最小值进行标准化处理。
# coding=utf-8
import numpy as np
from matplotlib import pyplot as plt
from matplotlib import cm
from matplotlib import axes
def draw_heatmap(data,xlabels,ylabels):
#cmap=cm.Blues
cmap=cm.get_cmap('rainbow',1000)
figure=plt.figure(facecolor='w')
ax=figure.add_subplot(1,1,1,position=[0.1,0.15,0.8,0.8])
ax.set_yticks(range(len(ylabels)))
ax.set_yticklabels(ylabels)
ax.set_xticks(range(len(xlabels)))
ax.set_xticklabels(xlabels)
vmax=data[0][0]
vmin=data[0][0]
for i in data:
for j in i:
if j>vmax:
vmax=j
if j<vmin:
vmin=j
map=ax.imshow(data,interpolation='nearest',cmap=cmap,aspect='auto',vmin=vmin,vmax=vmax)
cb=plt.colorbar(mappable=map,cax=None,ax=None,shrink=0.5)
plt.show()
a=np.random.rand(10,10)
print a
xlabels=['A','B','C','D','E','F','G','H','I','J']
ylabels=['a','b','c','d','e','f','g','h','i','j']
draw_heatmap(a,xlabels,ylabels)
运行结果如下图所示:
最后希望这篇文章对你有所帮助,该篇文章的重点知识不是画图,而是后续的研究:
1.如何通过热图来描绘人类动力学兴趣转换点;
2.图像处理感兴趣的同学,会通过imshow()处理相关知识;
3.用热图颜色表示差异,体现矩阵数据的关注点。
同时推荐大家阅读电子科技大学,赵志丹老师的博士论文《人类行为时空特性的分析建模及动力学研究》,下一篇文章我将简单讲述人类时空分析及结合Python绘图简单介绍。因为最近研究这方面知识,希望对你有所帮助,如果文章存在错误或不足之处,还请海涵。
真的好忙啊,都没时间做很多自己喜欢的事情,写文也是,但每当想起你,我这张丑脸上总会泛起微笑。加油,秀璋。娜娜,晚安!
(By:Eastmount 2017-06-19 晚上12点 http://blog.csdn.net/eastmount/ )http://blog.csdn.net/Eastmount/article/details/73392106?locationNum=3&fps=1