算法
文章平均质量分 95
SongDI911
这个作者很懒,什么都没留下…
展开
-
浅谈强化学习中 Q-Learning 与Sarsa的异同
浅谈强化学习中Q-Learning与Sarsa的异同 作者:山松 我相信,从某种意义上讲,强化学习是人工智能的未来。 ——强化学习之父,Richard Sutton 简单来说就是,智能体通过强化学习,可以知道自己在什么状态下,应该采取什么样的动作使得自身获得最大奖励。强化学习分为在线学习和离线学习,本文以Q-learning(离线)和Sarsa(在线)出发,浅谈两者异同。 1. 简述Q-learning Q-Learning是强化学习算法中Value-based中的一种算法,Q即为Q(s,a)就原创 2021-08-16 10:10:01 · 560 阅读 · 0 评论 -
机器学习之knn-邻近算法
一,简介 邻近算法,或者说K最近邻(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法 。 二,算法原理 通过欧式距离公式计算两个向量点 xA、xB之间的距离: d=(xA0−xB0)2+(xA1−xB1)2 d=\sqrt{(xA_0-xB_0)^2+(xA_1-xB_1)^2} d=(xA0−xB0)2+(xA1原创 2020-10-13 10:37:06 · 380 阅读 · 3 评论