采样之拒绝采样

最新推荐文章于 2025-03-10 10:50:29 发布

智元说车

最新推荐文章于 2025-03-10 10:50:29 发布

阅读量2.7k

点赞数 2

分类专栏：机器学习文章标签：机器学习算法采样

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012771351/article/details/53064579

版权

机器学习专栏收录该内容

35 篇文章

订阅专栏

注：本文中所有公式和思路来自于邹博先生的《机器学习升级版》，我只是为了加深记忆和理解写的本文。

第一次接触到采样这个词的时候我感觉别扭，因为觉得不是有现成的样本数据么，直接处理后喂给模型不就行了么干嘛要多此一举呢？

其实我们可以这样来理解采样：

采样时前提是我们已经确定一个系统(概率分布)，但是不知道满足该分布背后的参数，然后我们根据这个概率分布从所有的样本中采样出n个样本，那么这n个样本必然也是满足这个概率分布，我们通过这些样本，将参数求出来。

我们都比较熟悉这样的方式：给定样本数据，然后通过优化极值来求得参数(SVM、logistic等)，这是频率学派的做法，在贝叶斯学派中，会用到采样的方式求得参数，地位上采样和优化是对等的。

这次先介绍一种采样方法--拒绝采样

从字面上便知，拒绝采样：带拒绝的采样

解释：假定现在有一个分布p(z)，但很遗憾，这个分布很复杂，我们不太容易直接按照p(z)分布采样，此时我们总是可以找到一个容易采样的分布q(z)(例：高斯分布)，我们将q(z)乘以一个系数k总可以拉伸这个分布，将原分布p(z)完全覆盖掉，如下图蓝色的线。

这样的话我们就可以在这个q(z)中做均匀采样，如果满足p(z)则接受该样本，不满足就拒绝掉。

再举一个小例子，假如现在要想在单位圆内做均匀采样：

方法一：我们就可以在单位圆外边画一个外切正方形，做拒绝采样，从而得到圆内的均匀样本。

方法二：

我们假设有两个从0到1的随机数，a，b。那么，我们另： r = a
      theta = b * 2 * Pi
上述随机点显然可以布满整个圆，但是并不是均匀分布的，简单略。
实际上，通过inverse sampling method，我们可以计算出正确的生成算法，即
      r = sqrt( a )
      theta = b * 2 * Pi
上述算法就是满足要求的了，即可以在圆的内部均匀分布了

拒绝采样的过程和思路比较简单，但是也有个显然易见的问题，会有一部分样本被丢弃掉，效率上也会差一些。后边会介绍更多的采样方法。

单位圆内均匀采样摘自就不告诉你1111的文章

博客等级

码龄12年

34
原创

68
点赞

120
收藏

64
粉丝

关注

私信

热门文章

分类专栏

机器学习 35篇
linux 2篇
deep learning 1篇

展开全部收起

最新评论

HMM之前向后向算法
weixin_46083434: 你好，非常感谢你的讲解让我可以把前向算法和后向算法结合起来理解，不过还有两个问题不是很明白，1. 单个状态的概率那个公式，分母P(o|lamda) 换成alphat(i)*betat(i)再对所有i（状态）求和，是因为生成观测序列o的总概率是t时刻下每个i（状态）可能的概率之和吗？ 2. 最后那个联合概率转换到最终结果不太明白，请问可以请教一下再具体一点的步骤吗？谢谢
LDA-隐狄利克雷分布-主题模型
leilei9406: 想请问下如果做短文拼接可以有哪些方法，我正在做一个短文本的LDA结果不是很好，可以请教下您吗？
变分算法
qq_36711371: 请问一下，P（x）和q（x）的距离公式中，α=1的时候，公式为什么会退化为KL(p||q)，α=1时，分母为0.
HMM之前向后向算法
Chester_ieee: 前后向概率的公式，i和t好像是写反了。
聚类之层次聚类与密度聚类
落入凡间的奥特曼: 你好，请问这个机器学习升级版是课程吗?

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。