我最近偶然发现了一个类似的问题,即如何使用MatPlotLib模块在Python中生成频率的热图。
这篇文章非常有用,我可以让各个脚本运行并为代码固有生成的随机测试数据创建热图。但是,我在修改代码以为正在使用的数据创建热图时遇到麻烦。数据采用逗号分隔格式(.csv)。
我目前在此.csv文件中保存了3788对平均质量评级。这些平均质量评级的范围均为0-5。我正在尝试创建一个热图,以x和y轴(0-.499,.5-.999、1-1.499)按0.5增量对数据进行分档等等)。
我想将.csv文件的第一列(webqualityratings)导入为热图的x值,并将.csv文件的第二列(inpersonqualityratings)导入为热图的y值。
我试图改编的" ptomato"发布的代码,并由Mike Graham编辑,如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13import numpy as np
import numpy.random
import matplotlib.pyplot as plt
# Generate some test data
x = np.random.randn(8873)
y = np.random.randn(8873)
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.clf()
plt.imshow(heatmap, extent=extent)
plt.show()
如果有人可以帮助我修改此代码以按照指定的方式从我的.csv文件中读取数据,我将万分感谢!
由于您可以使用numpy并假设您的csv文件行为良好,因此可以使用numpy.loadtxt(),
1
2
3
4
5
6
7
8
9
10
11
12import numpy as np
import matplotlib.pyplot as plt
dat = np.loadtxt('mydata.csv')
x, y = dat[:,0], dat[:,1]
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.clf()
plt.imshow(heatmap, extent=extent)
plt.show()
Python具有绝对壮观的csv文件库:
http://docs.python.org/library/csv.html
虽然我不知道matplotlib的详细信息,但是以下代码将在制表符分隔的csv文件中循环并在第一和第二列上执行您的代码。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17import numpy as np
import numpy.random
import matplotlib.pyplot as plt
import csv
with open(yourInputFile,"rb") as mycsv:
reader = csv.DictReader(mycsv, dialect='excel-tab')
for row in reader:
x = row['name of first column']
y = row['name of second column']
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.clf()
plt.imshow(heatmap, extent=extent)
plt.show()
请注意,我使用的是DictReader变体,它需要一个标头才能工作。 要么在文件的开头,要么作为构造函数的输入。 您也可以使用常规阅读器,但是它使用列号而不是名称,并且在100多个字段上不方便。
您可以更改特定csv文件的方言,甚至在需要时创建自己的方言。
最后,请注意,我对matplotlib一无所知,并且那段代码很可能是错误的。