Python基础(四)

文章目录

Chapter15 数据可视化_生成数据

数据可视化指的是通过可视化表示来探索数据,它与数据挖掘紧密相关,而数据挖掘指的是使用代码来探索数据集的规律和关联。数据集可以是用一行代码就能表示的小型数字列表,也可以是数以G字节的数据。

学习内容:

  • matplotlib,将使用它来制作简单的图表,如折线图和散点图
  • 还将使用Pygal包,它专注于生成适合在数字设备上显示的图表

15.1 安装matplotlib

15.1.1 在 Linux 系统中安装 matplotlib

系统自带的Python版本:
$ sudo apt-get install python3-matplotlib

Python 2.7:
$ sudo apt-get install python-matplotlib

如果安装了较新的Python版本,就必须安装matplotlib依赖的一些库:
$ sudo apt-get install python3.5-dev python3.5-tk tk-dev
$ sudo apt-get install libfreetype6-dev g++
$ pip install --user matplotlib

15.1.3 在 Windows 系统中安装 matplotlib

首先需要安装Visual Studio

接下来,需要下载matplotlib安装程序。为此,请访问https://pypi.python.org/pypi/matplotlib/,
并查找与你使用的Python版本匹配的wheel文件(扩展名为.whl的文件)

将这个.whl文件复制到你的项目文件夹,打开一个命令窗口,并切换到该项目文件夹

再使用pip来安装matplotlib:
> cd python_work
python_work> python -m pip install --user matplotlib-1.4.3-cp35-none-win32.whl

15.1.4 测试 matplotlib

import matplotlib

15.1.5 matplotlib 画廊

要查看使用matplotlib可制作的各种图表,请访问http://matplotlib.org/的示例画廊。单击画廊中的图表,就可查看用于生成图表的代码。

15.2 绘制简单的折线图

import matplotlib.pyplot as plt
'''导入了模块pyplot,定了别名plt'''

squares = [1, 4, 9, 16, 25]
plt.plot(squares)
plt.show() # 打开matplotlib查看器,并显示绘制的图形

做的图

15.2.1 修改标签文字和线条粗细

import matplotlib.pyplot as plt

squares = [1, 4, 9, 16, 25]
plt.plot(squares, linewidth=5) # linewidth:线条粗细参数

plt.title("Square Numbers", fontsize=24) # 标题及字体
plt.xlabel("Value", fontsize=14) # x轴标题及字体
plt.ylabel("Square of Value", fontsize=14) # y轴标题及字体
plt.tick_params(axis='both', labelsize=14) # 刻度大小

plt.show()

标签文字和线条粗细

15.2.2 校正图形

'''横坐标的平方对应纵坐标的值'''

import matplotlib.pyplot as plt

input_values = [1, 2, 3, 4, 5]
squares = [1, 4, 9, 16, 25]

plt.plot(input_values, squares, linewidth=5) # 横坐标的平方对应纵坐标的值

plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)
plt.tick_params(axis='both', labelsize=14)

plt.show()

15.2.3 使用scatter()绘制散点图并设置其样式

可能想以一种颜色显示较小的值,而用另一种颜色显示较大的值。绘制大型数据集时,你还可以对每个点都设置同样的样式,再使用不同的样式选项重新绘制某些点,以突出它们。

import matplotlib.pyplot as plt

plt.scatter(2, 4) # 单点:传递x,y坐标
plt.show()


import matplotlib.pyplot as plt

plt.scatter(2, 4, s=200) # 参数s决定绘制点的尺寸
plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)

plt.tick_params(axis='both', which='major', labelsize=14)

plt.show()

散点图

15.2.4 使用scatter()绘制一系列点

import matplotlib.pyplot as plt

x_values = [1, 2, 3, 4, 5]
y_values = [1, 4, 9, 16, 25]
plt.scatter(x_values, y_values, s=100) # 一系列点传入

plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)

plt.tick_params(axis='both', which='major', labelsize=14)

plt.show()

在这里插入图片描述

15.2.5 自动计算数据

import matplotlib.pyplot as plt

x_values = list(range(1, 1001))
y_values = [x**2 for x in x_values] # x的平方值:解析列表

plt.scatter(x_values, y_values, s=40)
plt.axis([0, 1100, 0, 1100000]) # axis指定x,y的取值范围

plt.show()

15.2.6 删除数据点的轮廓 edgecolor=‘none’

plt.scatter(x_values, y_values, edgecolor='none', s=40)
plt.show()

15.2.7 自定义颜色:参数c

plt.scatter(x_values, y_values, c='red', edgecolor='none', s=40)
plt.show()

plt.scatter(x_values, y_values, c=(0, 0, 0.8), edgecolor='none', s=40)
plt.show() # 表示红色,绿色,蓝色的分量。输出是深蓝色,越接近1颜色越浅

15.2.8 使用颜色映射:colormap

颜色映射(colormap)是一系列颜色,它们从起始颜色渐变到结束颜色。在可视化中,颜色映射用于突出数据的规律,例如,你可能用较浅的颜色来显示较小的值,并使用较深的颜色来显示较大的值。

import matplotlib.pyplot as plt

x_values = list(range(1001))
y_values = [x**2 for x in x_values]

plt.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Blues,
    edgecolor='none', s=40) # cmap表示哪种渐变色,y值小的颜色浅大的颜色深

plt.title("Square Numbers", fontsize=24)
plt.xlabel("Value", fontsize=14)
plt.ylabel("Square of Value", fontsize=14)

plt.tick_params(axis='both', which='major', labelsize=14)

plt.show()

在这里插入图片描述

15.2.9 自动保存图表

要让程序自动将图表保存到文件中,可将对plt.show()的调用替换为对plt.savefig()的调用

plt.savefig('squares_plot.png', bbox_inches='tight')
# 第一个参数表示文件名和路径,第二个参数表示将空白区域减掉,默认是留存

15.3 随机游走

将使用Python来生成随机漫步数据,再使用matplotlib以引人瞩目的方式将这些数据呈现出来。随机漫步是这样行走得到的路径:

  • 每次行走都完全是随机的,没有明确的方向,结果是由一系列随机决策决定的。
  • 可以这样认为,随机漫步就是蚂蚁在晕头转向的情况下,每次都沿随机的方向前行所经过的路径。

15.3.1 创建RandomWalk()类

为模拟随机游走,创建一个名为RandomWalk的类,它随机地选择前进方向。

这个类需要三个属性:
其中一个是存储随机游走次数的变量,其他两个是列表,分别存储随机游走经过的每个点的x和y坐标。

RandomWalk类只包含两个方法:
__init__ ()fill_walk(),其中后者计算随机漫步经过的所有点。

from random import choice

class RandomWalk():
    """一个生成随机漫步数据的类"""

    def __init__(self, num_points=5000): # 默认点数为500
        """初始化随机漫步的属性"""
        self.num_points = num_points

        # 所有随机漫步都始于(0, 0)
        self.x_values = [0]
        self.y_values = [0]

15.3.2 选择方向

# 将其加入到上面的类中
def fill_walk(self):
    """计算随机漫步包含的所有点"""

    # 不断漫步,直到列表达到指定的长度
    while len(self.x_values) < self.num_points:

        # 决定前进方向以及沿这个方向前进的距离
        x_direction = choice([1, -1]) # x的选择,又走1或左走1
        x_distance = choice([0, 1, 2, 3, 4]) # 沿着方向走的距离0~4
        x_step = x_direction * x_distance # 沿着x轴走的距离

        y_direction = choice([1, -1])
        y_distance = choice([0, 1, 2, 3, 4])
        y_step = y_direction * y_distance

        # 拒绝原地踏步
        if x_step == 0 and y_step == 0:
            continue # 接着执行下一个循环

        # 计算下一个点的x和y值,x_values最后一个值和x_step相加
        next_x = self.x_values[-1] + x_step
        next_y = self.y_values[-1] + y_step

        self.x_values.append(next_x) # 下一个点追加到x值的末尾
        self.y_values.append
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值