数据可视化
蟒蛇书源代码下载:图灵社区随书下载
数据可视化指的是通过可视化表示来探索数据,它与数据分析紧密相关,而数据分析指的是使用代码来探索数据集的规律和关联。数据集可以是用一行代码就能表示小型数字列表,也可以是数千兆字节的数据。
安装Matplotlib
在终端提示符下执行如下命令:
python -m pip --user matplotlib
执行完后结果如下图所示则说明安装成功
常见错误:
报告警告,提示相应的路径没有添加到PATH里面,可能会引起导不了包。
解决方案:
在环境变量PATH里面加入相应路径后,重新在终端执行命令即可。
绘制简单折线图
小知识:
可以通过Matplotlib画廊来获取你想要图表的代码
折线图
效果图如下:
实例代码如下:
import matplotlib.pyplot as plt
input_values = [1,2,3,4,5]
squares = [1,4,9,16,25]
fig,ax = plt.subplots()
# 描绘线条的粗细
ax.plot(input_values,squares,linewidth=3)
# 设置图表标题并给坐标轴加上标签
ax.set_title("squares",fontsize=24)
ax.set_xlabel("value", fontsize=14)
ax.set_ylabel("value's squares",fontsize=14)
# 设置刻度标记的大小
ax.tick_params(axis='both',labelsize=14)
plt.show()
散点图
效果图如下:
代码如下:
import matplotlib.pyplot as plt
x_values = range(1,1001)
y_values = [x**2 for x in x_values]
plt.style.use('seaborn')
fig,ax = plt.subplots()
ax.scatter(x_values,y_values,c=y_values,cmap=plt.cm.Blues,s=10)
# 设置图表标题并给坐标加上标签
ax.set_title("squares",fontsize=24)
ax.set_xlabel("value",fontsize=14)
ax.set_ylabel("value's squares",fontsize=14)
# 设置刻度标记的大小
ax.tick_params(axis='both',which='major',labelsize=24)
# 设置每个坐标轴的取值范围
ax.axis([0,1100,0,1100000])
plt.show()
随机漫步图
效果如下:
代码如下:
rw_visual.py
import matplotlib.pyplot as plt
from random_walk import RandomWalk
# 只要程序处于活动状态,就不断地模拟随机漫步
while True:
# 创建一个Random_walk实例
rw = RandomWalk(50_000)
rw.fill_walk()
# 将所有的点都绘制出来
plt.style.use('classic')
fig,ax = plt.subplots(figsize=(15,9))
point_numbers = range(rw.num_points)
ax.scatter(rw.x_values,rw.y_values,c=point_numbers,cmap=plt.cm.Blues,edgecolors='none',s=1)
# 突出起点和终点
ax.scatter(0,0,c='green',edgecolors='none',s=100)
ax.scatter(rw.x_values[-1],rw.y_values[-1],c='red',edgecolors='none')
# 隐藏坐标轴
ax.get_xaxis().set_visible(False)
ax.get_yaxis().set_visible(False)
plt.show()
keep_runnig = input("Make another walk?(y/n): ")
if keep_runnig == 'n':
break
random_walk.py
from random import choice
class RandomWalk:
""" 一个生成随机漫步数据的类 """
def __init__(self,num_points=5000):
# 初始化随机漫步的属性
self.num_points = num_points
# 所有的随机漫步种子都始于(0,0)
self.x_values = [0]
self.y_values = [0]
def fill_walk(self):
""" 计算随机漫步包含的所有点 """
while len(self.x_values) < self.num_points:
# 决定前进方向以及这个方向前进的距离
x_direction = choice([1,-1])
x_distance = choice([0,1,2,3,4])
x_step = x_direction * x_distance
y_direction = choice([1,-1])
y_distance = choice([0,1,2,3,4])
y_step = y_direction * y_distance
# 拒绝原地踏步
if x_step == 0 and y_step == 0:
continue
# 计算下一个点的x和y的值
x = self.x_values[-1] + x_step
y = self.y_values[-1] + y_step
self.x_values.append(x)
self.y_values.append(y)
安装Plotly
在终端提示符下执行如下命令:
python -m pip --user plotly
出现下图所示即安装成功
绘制直方图模拟投掷筛
效果如下图所示:
代码如下所示:
创建Die类(die.py):
from random import randint
class Die:
""" 表示一个骰子的类 """
def __init__(self,num_sides=6):
""" 骰子默认6面 """
self.num_sides = num_sides
def roll(self):
""" 返回一个位于1和骰子面数之间的随机值 """
return randint(1,self.num_sides)
die_visual.py
from die import Die
from plotly.graph_objs import Bar,Layout
from plotly import offline
# 创建一个D6
die = Die()
# 投掷几次骰子并将结果存储在一个队列列表中
results = []
for roll_num in range(10000):
result = die.roll()
results.append(result)
# 分析结果
frequencies = []
for value in range(1,die.num_sides+1):
frequency = results.count(value)
frequencies.append(frequency)
# 对结果进行可视化分析
x_values = list(range(1,die.num_sides+1))
data = [Bar(x=x_values,y=frequencies)]
x_axis_config = {'title':'结果'}
y_axis_config = {'title':'结果的频率'}
my_layout = Layout(title='投掷一个D6 10000 次的结果',
xaxis=x_axis_config,yaxis=y_axis_config)
offline.plot({'data':data,'layout':my_layout},filename='d6.html')