CartPole-v1线性模型局限

最新推荐文章于 2024-07-04 10:35:23 发布

pysnow530

最新推荐文章于 2024-07-04 10:35:23 发布

阅读量527

点赞数

分类专栏：机器学习文章标签：机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/colin5300/article/details/118247675

版权

本文分析了CartPole-v1问题中线性模型的局限，指出仿射函数无法捕捉非线性关系，导致信息丢失。线性模型仅能处理特定情况，无法应对所有样本，特别是在角度和角速度变化量的关系上。解决方案是引入非线性能力，如增加神经网络层数和调整激活函数。

摘要由CSDN通过智能技术生成

CartPole-v1线性模型局限 - 神经元非线性能力

背景

上篇文章有尝试使用最简单的单一神经元来解决CartPole-v1问题，模型比较简单，但是会存在两个比较明显的问题。

针对问题2 大部分回合500，但是后期仍会出现回报较低的情况，最近几天学习了一些资料，这篇文章尝试着从数学的角度对其做一个解释。

从仿射函数说起

这里直接一点，先给出仿射函数(affine function)的公式：

$\Sigma_{i=1}^nw_ix_i$

下面是神经元的计算公式：

$z = w x + b$
$\sigma(z)$

可以看出，神经元实际上就是仿射函数和激活函数组成的复合函数。

仿射函数的计算表示

这里我们拿到向量的维度里来描述仿射函数。形式上，向量的内积跟去掉偏置(bias)的向量内积在形式上是等价的。

假设 $x, y$ 为 $n$ 维向量，向量内积计算公式：

< $x, y$ > $x_1y_1 + x_2 y_2 + ... + x_ny_n = \Sigma_{i=1}^nx_iy_i$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pysnow530 CSDN认证博客专家 CSDN认证企业博客

码龄14年

33: 原创

15万+: 周排名

108万+: 总排名

8万+: 访问

: 等级

1174: 积分

6: 粉丝

21: 获赞

23: 评论

29: 收藏

私信

关注

热门文章

分类专栏

机器学习 2篇
gentoo linux 2篇
guile
android 3篇
enjoy 1篇
tools 1篇
Node.js 1篇
php 2篇
Ruby 1篇
git 3篇
python 1篇
生活 1篇
tool 2篇
系统设计 1篇
思考 3篇
想法
go 2篇

最新评论

CartPole-v1线性模型局限
CSDN-Ada助手: 非常感谢CSDN博主的分享，关于CartPole-v1线性模型的局限性，确实是一个非常有趣的话题。我建议下一篇博客可以继续探讨强化学习中其他模型的优缺点，比如深度强化学习、策略梯度等方面，也可以结合实战案例进行讲解，这样的技术文章对其他用户学习强化学习会有很大的帮助和启发。相信会有更多读者期待您的下一篇文章。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
为什么我不使用JetBrains的屌炸天编辑器
qiyujie123: 为什么不考虑下是你电脑配置该升级了呢？
CartPole-v1 50行python实现
pysnow530: 小白，刚开始学习，一起交流呀
CartPole-v1 50行python实现
空中旋转篮球: 好专业！
为什么我不使用JetBrains的屌炸天编辑器
jjdoor: 生产力的提高才是第一要素。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。