python自动驾驶应用_Python 实现基于深度强化学习算法实现的一个简单自动驾驶 AI 【PyTorch】...

最新推荐文章于 2024-05-01 08:04:24 发布

weixin_39676034

最新推荐文章于 2024-05-01 08:04:24 发布

阅读量1.3k

点赞数 1

文章标签： python自动驾驶应用

A simple self-driving car AI python script using the deep Q-learning algorithm

learning=>

after a while=>

此无人车AI项目使用的Deep Q-learning算法，是DeepMind在2013年发明的深度强化学习算法，将Q-learning的思想与神经网络算法结合，也算是现代强化学习算法的源头了。研究者用这个算法在2015年让计算机学会了49种Atari游戏，并在大部分游戏中击败了人类。从适用性上来讲，我们不需要告诉AI具体的规则，只要让它不断摸索，它就能慢慢从中找到规律，完成许多之前被认为只有人类能完成的智力活动。

既然是Q-learning和Deep learning的结合，就先结合无人车AI来讨论什么是Q-learning。

Q-learning是一种强化学习算法，无人车需要根据当前状态来采取动作，获得相应的奖励之后，再去改进这些动作，使得下次再到相同的状态时，无人车能做出更优的选择。我们用Q(S,A)表示在S状态时，采取A动作所获得的效用值。下面用字母R代表奖励(Rewards)，S'代表采取A动作后到达的新位置。(奖励值R与效用值Q的区别在于，R表示的是这个位置的奖励，比如对于无人车而言障碍物的位置奖励是-100，河流的位置奖励是-120，柏油路的奖励是100，沙路的奖励是50。而Q代表的是，采取这个动作的效用值，用于评价在特定状态下采取这个动作的优劣，可以将之理解为无人车的大脑，它是对所有已知状态的综合考虑) 伪代码如下：

Initialize Q arbitrarily // 随机初始化Q值

最低0.47元/天解锁文章

weixin_39676034

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
python自动驾驶应用_Python 实现基于深度强化学习算法实现的一个简单自动驾驶 AI 【PyTorch】...

A simple self-driving car AI python script using the deep Q-learning algorithmlearning=>after a while=>此无人车AI项目使用的Deep Q-learning算法，是DeepMind在2013年发明的深度强化学习算法，将Q-learning的思想与神经网络算法结合，也算是现代强化学习算法的源头了。研...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。