torch 离散数据依概率抽样

最新推荐文章于 2025-03-02 22:05:23 发布

高山莫衣

最新推荐文章于 2025-03-02 22:05:23 发布

阅读量790

点赞数 1

分类专栏： pytorch 文章标签： python 开发语言

原创作品，共同进步！

本文链接：https://blog.csdn.net/AdamCY888/article/details/131037249

版权

pytorch 专栏收录该内容

66 篇文章

订阅专栏

参数介绍

sample = torch.multinomial(x, num_samples=10, replacement=True)

x表示概率分布，num_samples=10表示每一次抽取10个元素，replacement=True/Fasle表示不放回抽样 / 放回抽样。

案例

假设10个数字分别为x1 ~ x10，要从10个数字里面抽取一个数字，下面的张量为3行10列的概率矩阵。
第一种情况，抽中每一个数字的概率分别为：[0.1005, 0.0987, 0.1000, 0.0988, 0.1007, 0.0999, 0.1005, 0.1018, 0.1003,0.0988]，将这一行作为概率分布进行抽样，抽取1个样本。同理第二种情况、第三种情况的概率分布分别是张量的第2、3行。

tensor([[0.1005, 0.0987, 0.1000, 0.0988, 0.1007, 0.0999, 0.1005, 0.1018, 0.1003,0.0988],
        [0.1011, 0.0985, 0.1005, 0.0997, 0.1010, 0.0996, 0.1004, 0.1027, 0.0992,0.0974],
        [0.1005, 0.0992, 0.1006, 0.0997, 0.1005, 0.0995, 0.1001, 0.1013, 0.0998,0.0987]])

要从每行作为概率分布的张量中抽取一个样本，可以使用torch.multinomial()函数。该函数接受一个包含概率分布的张量和要抽取的样本数量作为输入，并返回对应的样本索引。

下面是一个示例代码，展示如何从给定的概率分布中抽取一个样本：

求解

import torch

x = torch.tensor([[0.1005, 0.0987, 0.1000, 0.0988, 0.1007, 0.0999, 0.1005, 0.1018, 0.1003, 0.0988],
                  [0.1011, 0.0985, 0.1005, 0.0997, 0.1010, 0.0996, 0.1004, 0.1027, 0.0992, 0.0974],
                  [0.1005, 0.0992, 0.1006, 0.0997, 0.1005, 0.0995, 0.1001, 0.1013, 0.0998, 0.0987]])

sample = torch.multinomial(x, num_samples=1)
print(sample)

输出结果为：

tensor([[6],
        [7],
        [7]])

在这个例子中，我们使用torch.multinomial(x, num_samples=1)从输入张量x的每行作为概率分布中抽取1个样本。num_samples=1表示每行只抽取一个样本。结果是一个包含抽样索引的张量，其中每行的索引表示从对应行的概率分布中抽取的样本。

请注意，抽取的样本索引是以列的形式返回的，即每行一个索引。如果您想获取抽取的样本值而不是索引，可以使用索引操作符（[ ]）将索引应用于原始张量，如下所示：

y = torch.tensor([11,12,13,14,15,16,17,18,19,20])
sample_values = y[torch.arange(y.size(0)), sample.squeeze()]
print(sample_values)

在这个例子中，我们使用索引操作符[]将抽样索引应用于原始张量x，并通过squeeze()函数将结果的形状从(3, 1)变为(3,)。然后，我们得到了抽取的样本值的张量sample_values，其中每个元素表示从对应行的概率分布中抽取的样本值。

torch.multinomial()函数根据概率分布进行抽样，因此输入的概率分布应该是非负数且总和为1。