Python学习之路日志—利用matplotlib开发数据可视化项目(2)

今天,我将继续利用matplotlib开发数据可视化项目的学习:

2.1 随机漫步:

首先,我将使用Python来生成随机漫步数据,再使用matplotlib将这些数据呈现出来。随机漫步是这样行走得到的路径:每次行走都完全是随机的,没有明确的方向,结果是由一系列随机决策决定的。

为模拟随机漫步,我将创建一个名为RandomWalk 的类,它随机地选择前进方向。这个类需要三个属性,其中一个是存储随机漫步次数的变量num_points,其他两个是列表x_valuesy_values,分别存储随机漫步经过的每个点的 x 和 y 坐标。 RandomWalk 类只包含两个方法:__init__()fill_walk() ,其中后者计算随机漫步经过的所有点:

在这里插入图片描述

# -*- coding:utf-8 -*-
from random import choice #每次做决策时都使用choice() 来决定使用哪种选择

class RandomWalk():
	#一个生成随机漫步数据的类

	def __init__(self, num_points = 6000):
		#初始化随机漫步的属性
		self.num_points = num_points

		# 所有随机漫步都始于(0, 0)
		self.x_values = [0]
		self.y_values = [0]

	def fill_walk(self):
		#计算随机漫步包含的所有点

		while len(self.x_values) < self.num_points: # 不断漫步,直到列表达到指定的长度

			# 决定前进方向以及沿这个方向前进的距离
			x_direction = choice([1,-1])
			x_distance = choice([0,1,2,3,4])
			x_step = x_direction * x_distance

			y_direction = choice([1,-1])
			y_distance = choice([0,1,2,3,4])
			y_step = y_direction * y_distance

			# 拒绝原地踏步
			if x_step == 0 and y_step == 0:
				continue

			# 计算下一个点的x和y值
			next_x = self.x_values[-1] + x_step
			next_y = self.y_values[-1] + y_step

			self.x_values.append(next_x)
			self.y_values.append(next_y)

为做出随机决策,将所有可能的选择都存储在一个列表中,并在每次做决策时都使用choice() 来决定使用哪种选择(见第2行)。接下来,我在第7行将随机漫步包含的默认点数设置为6000,这大到足以生成有趣的模式,同时又足够小,可确保能够快速地模拟随机漫步。然后,在12-13行处,我们创建了两个用于存储 x 和 y 值的列表,并让每次漫步都从(0, 0)出发。

我们将使用fill_walk() 来生成漫步包含的点,并决定每次漫步的方向。在第18行处,我们建立了一个循环,这个循环不断运行,直到漫步包含所需数量的点。我们使用choice([1, -1])x_direction 选择一个值,结果要么是表示向右走的 1 ,要么是表示向左走的 -1(见第21行)。接下来,choice([0, 1, 2, 3, 4]) 随机地选择一个0~4之间的整数,告诉Python沿指定的方向走多远(x_distance )。(通过包含0,我们不仅能够沿两个轴移动,还能够沿 y 轴移动。) 在第23行和第27行处,我们将移动方向乘以移动距离,以确定沿 x 和 y 轴移动的距离。如果x_step 为正,将向右移动,为负将向左移动,而为零将垂直移动;如果y_step 为正,就意味着向上移动,为负意味着向下移动,而为零意味着水平移动。如果x_stepy_step 都为零,则意味着原地踏步,我们拒绝这样的情况,接着执行下一次循环(见29-31行)。 为获取漫步中下一个点的 x 值,我们将x_stepx_values 中的最后一个值相加(见第34行),对于 y 值也做相同的处理。获得下一个点的 x 值和 y 值后,我们将它们分别附加到列表x_valuesy_values 的末尾。

下面的代码将随机漫步的所有点都绘制出来:

在这里插入图片描述

import matplotlib.pyplot as plt

from random_walk import RandomWalk

# 创建一个RandomWalk实例,并将其包含的点都绘制出来

rw = RandomWalk()
rw.fill_walk()
plt.scatter(rw.x_values, rw.y_values, s=13)
plt.show()

我们首先导入了模块pyplotRandomWalk 类,然后创建了一个RandomWalk 实例,并将其存储到rw中(见第8行),再调用fill_walk() 。在第10行处,我将随机漫步包含的 x 和 y 值传递给scatter() ,并选择了合适的点尺寸(13)。下图显示了包含6000个点的随机漫步图:

在这里插入图片描述


2.2 设置随机漫步图的样式:

现在,我们将定制图表,以突出每次漫步的重要特征,并让部分元素不那么显眼:

2.2.1 给点着色:

我们将使用颜色映射来指出漫步中各点的先后顺序,并删除每个点的黑色轮廓,让它们的颜色更明显。为根据漫步中各点的先后顺序进行着色,我们传递参数c ,并将其设置为一个列表,其中包含各点的先后顺序。由于这些点是按顺序绘制的,因此给参数c 指定的列表只需包含数字1~5000,如下所示:

在这里插入图片描述

# -*- coding:utf-8 -*-
import matplotlib.pyplot as plt

from random_walk import RandomWalk



while True:
	# 创建一个RandomWalk实例,并将其包含的点都绘制出来

	rw = RandomWalk()
	rw.fill_walk()

	point_numbers = list(range(rw.num_points))#生成了一个数字列表,其中包含的数字个数与漫步包含的点数相同。
	plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Greens,
		 edgecolor='none', s=13)
	plt.show()

在14行处,我们使用了range() 生成了一个数字列表,其中包含的数字个数与漫步包含的点数相同。接下来,我们将这个列表存储在point_numbers 中,以便后面使用它来设置每个漫步点的颜色。我们将参数c 设置为point_numbers ,指定使用颜色映射Greens ,并传递实参edgecolor=none 以删除每个点周围的轮廓。最终的随机漫步图从浅绿色渐变为深绿色,如图所示:

在这里插入图片描述
2.2.2 重新绘制起点和终点:

除了给随机漫步的各个点着色,以指出它们的先后顺序外,我们还希望能呈现随机漫步的起点和终点。为此,可在绘制随机漫步图后重新绘制起点和终点。我们让起点和终点变得更大,并显示为不同的颜色,以突出它们,如下所示:

在这里插入图片描述

# -*- coding:utf-8 -*-
import matplotlib.pyplot as plt

from random_walk import RandomWalk



while True:
	# 创建一个RandomWalk实例,并将其包含的点都绘制出来

	rw = RandomWalk()
	rw.fill_walk()

	point_numbers = list(range(rw.num_points))#生成了一个数字列表,其中包含的数字个数与漫步包含的点数相同。
	plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Reds,
		 edgecolor='none', s=13)

	# 突出起点和终点
	plt.scatter(0, 0, c='BluE', edgecolors='none', s=150)
	plt.scatter(rw.x_values[-1], rw.y_values[-1], c='Red', edgecolors='none', s=150)

	plt.show()

为突出起点,我们使用蓝色绘制点(0, 0),并使其比其他点大(s=150 )。为突出终点,我们在漫步包含的最后一个 x 和 y 值处绘制一个点,将其颜色设置为红色,并将尺寸设置为150。然后将这些代码放在画其他点的代码的后面,确保在其他点的上面绘制起点和终点。 如果你现在运行这些代码,将能准确地知道每次随机漫步的起点和终点:

在这里插入图片描述
2.2.3 隐藏坐标轴:

下面来隐藏这个图表中的坐标轴,以免我们注意的是坐标轴而不是随机漫步路径:

在这里插入图片描述

# -*- coding:utf-8 -*-
import matplotlib.pyplot as plt

from random_walk import RandomWalk



while True:
	# 创建一个RandomWalk实例,并将其包含的点都绘制出来

	rw = RandomWalk()
	rw.fill_walk()

	point_numbers = list(range(rw.num_points))#生成了一个数字列表,其中包含的数字个数与漫步包含的点数相同。
	plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Reds,
		 edgecolor='none', s=13)

	# 突出起点和终点
	plt.scatter(0, 0, c='BluE', edgecolors='none', s=150)
	plt.scatter(rw.x_values[-1], rw.y_values[-1], c='Red', edgecolors='none', s=150)

	# 隐藏坐标轴
	plt.axes().get_xaxis().set_visible(False)
	plt.axes().get_yaxis().set_visible(False)

	plt.show()

为修改坐标轴,使用了函数plt.axes() (见23-24行)来将每条坐标轴的可见性都设置为False 。随着你越来越多地进行数据可视化,经常会看到这种串接方法的方式。 如果你现在运行,将看到一系列图形,但看不到坐标轴:

在这里插入图片描述


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值