《动手学深度学习》——2.6概率(模拟掷色子代码解析)

完整代码

%matplotlib inline
!pip install d2l
import torch
from torch.distributions import multinomial
from d2l import torch as d2l
fair_probs = torch.ones([6]) / 6
counts = multinomial.Multinomial(10, fair_probs).sample((500,))
cum_counts = counts.cumsum(dim=0)
estimates = cum_counts / cum_counts.sum(dim=1, keepdims=True)
d2l.set_figsize((6, 4.5))
for i in range(6):
  d2l.plt.plot(estimates[:, i].numpy(),
  label=("P(die=" + str(i + 1) + ")"))
d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')
d2l.plt.gca().set_xlabel('Groups of experiments')
d2l.plt.gca().set_ylabel('Estimated probability')
d2l.plt.legend()

代码解析

fair_probs = torch.ones([6]) / 6

这段代码的作用是创建一个张量fair_probs,其中包含每个点数的理论概率。具体来说,它创建一个长度为6的张量,每个元素都是1/6。然后它通过除以6来将每个元素归一化为概率,以便它们的总和等于1。这样,我们就可以使用fair_probs来模拟掷骰子实验,并计算每个点数的理论概率。


counts = multinomial.Multinomial(10, fair_probs).sample((500,))
cum_counts = counts.cumsum(dim=0)

这段代码的作用是使用多项式分布模拟掷骰子实验,并计算每个点数出现的次数和累计次数。具体而言,它包括以下步骤:

multinomial.Multinomial(10, fair_probs)创建一个多项式分布对象,该对象可以模拟投掷10次骰子的实验,并使用fair_probs作为每个点数的概率。这里,fair_probs是一个长度为6的张量,其中每个元素都是1/6,表示每个点数的理论概率。

.sample((500,))使用该多项式分布对象进行500次实验,并返回一个形状为(500, 6)的张量,其中每个元素表示相应点数在该实验中出现的次数。

.cumsum(dim=0)计算每个点数的累计次数。具体而言,它在每个列向量上执行累加操作,返回一个形状为(500, 6)的张量,其中每个元素表示前i个实验中相应点数的累计次数。


estimates = cum_counts / cum_counts.sum(dim=1, keepdims=True)

这段代码的作用是计算每个点数出现的概率估计值。具体而言,它通过将每个点数的累计计数除以所有点数的累计计数之和来计算概率估计值。这个计算涉及到一些维度的操作:

cum_counts是一个形状为(500, 6)的张量,其中第i行表示前i个实验中每个点数出现的累计计数。

cum_counts.sum(dim=1, keepdims=True)表示对cum_counts的第1个维度求和,即对所有实验的累计计数求和。这将返回一个形状为(500, 1)的张量,其中每个元素都是所有点数的累计计数之和。

cum_counts / cum_counts.sum(dim=1, keepdims=True)表示将cum_counts中的每个元素除以相应的点数的累计计数之和。这将返回一个形状为(500, 6)的张量,其中每个元素都是相应点数的概率估计值。keepdims=True表示保持结果张量的维度数与输入张量的维度数相同。


d2l.set_figsize((6, 4.5))

这段代码的作用是设置图形的大小。具体而言,它使用set_figsize函数设置图形的宽度和高度。该函数需要一个形状为2的元组作为参数,其中第一个元素表示图形的宽度,第二个元素表示图形的高度。在这个例子中,宽度被设置为6,高度被设置为4.5。这将使得绘制出的图形具有与默认大小不同的外观,更适合于我们的显示需求。


for i in range(6):
d2l.plt.plot(estimates[:, i].numpy(),
label=("P(die=" + str(i + 1) + ")"))

这段代码使用一个for循环迭代6次,每次迭代都会绘制一个柱状图。在每次迭代中,它选择一个不同的点数(1到6),并绘制每个实验组的概率估计值。具体而言,estimates[:, i].numpy()选择所有实验组的第i个元素,并转换为NumPy数组。然后,它使用该数组绘制一个柱状图,并为该柱状图添加一个标签,该标签指示这个点数的出现概率。标签的格式为“P(die=X)”,其中X是点数。例如,“P(die=1)”表示点数为1的概率。因此,该代码段绘制了每个点数出现的概率随时间变化的曲线。


d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')
d2l.plt.gca().set_xlabel('Groups of experiments')
d2l.plt.gca().set_ylabel('Estimated probability')
d2l.plt.legend()

d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')添加一条水平虚线,该线表示每个点数的理论概率,即1/6。这将帮助我们比较估计值和理论值之间的差距。

d2l.plt.gca().set_xlabel('Groups of experiments')和d2l.plt.gca().set_ylabel('Estimated probability')添加x轴和y轴标签,以便我们知道这个图是关于什么的,并了解每个轴的单位。

d2l.plt.legend()添加图例,以便我们知道每个线条代表什么。每个线条代表一个点数的概率估计值,标签格式为“P(die=X)”,其中X是点数。

结果展示

在这里插入图片描述

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FeatherWaves

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值