CS 188 Project4(RL) Q0:DiscreteDistribution Class

最新推荐文章于 2024-07-08 21:31:35 发布

段智华

最新推荐文章于 2024-07-08 21:31:35 发布

阅读量1.2k

点赞数

分类专栏： AI & Big Data案例实战课程

热烈祝贺Gavin大咖2024年北京航空航天大学两本新书《Transformer&ChatGPT解密：原理、源码及案例》、《Transformer& Rasa 解密: 原理、源码及案例》出版发行

本文链接：https://blog.csdn.net/duan_zhihua/article/details/88884882

版权

AI & Big Data案例实战课程专栏收录该内容

167 篇文章 337 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

该项目使用DiscreteDistribution类来建模信念和权重分布，该类扩展了Python字典。主要实现normalize方法进行分布归一化和sample方法进行概率抽样。normalize方法保证总和为1，不改变比例；sample方法按比例抽取样本，无需先归一化。虽然没有自动测试，但提供了doctest进行手动验证。正确实现应确保样本频率与分布值成比例。

摘要由CSDN通过智能技术生成

在整个项目中，我们将使用在inference.py中定义的DiscreteDistribution类来建模信念分布和权重分布。这个类是内置python dictionary类的扩展，其中键是分布中不同的离散元素，相应的值与该元素的信念或权重成比例。

首先，实现normalize方法，它将分布中的值归一化为1，但保持值的比例不变。使用total方法查找分布中的值之和。对于空分布或所有值都为零的分布，不执行任何操作。请注意，此方法直接修改分布，而不是返回新分布。

其次，实现抽样sample方法，该方法从分布中抽取一个样本，其中一个键被抽样的概率与其对应的值成比例。假设分布不为空，并非所有值都为零。请注意，在调用此方法之前，不必对分布进行归一化。您可能会发现python的内置random.random（）函数对于这个问题很有用。

这个问题没有autograder测试，但是可以很容易地检查实现的正确性。我们提供了python doctest作为起点，您可以添加更多测试并实现自己的其他测试。您可以使用以下命令运行doctests：

python  -m doctest -v inference.py

注意，根据sample方法的实现细节，某些正确的实现可能不会通过提供的doctest。为了彻底检查sample

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

段智华 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。