机器学习
fly2cd
这个作者很懒,什么都没留下…
展开
-
RL两大类算法的本质区别?(Policy Gradient 和 Q-Learning)
Q-learning 是一种基于值函数估计的强化学习方法,Policy Gradient是一种策略搜索强化学习方法。两者是求解强化学习问题的不同方法,如果熟悉监督学习,前者可类比Naive Bayes——通过估计后验概率来得到预测,后者可类比SVM——不估计后验概率而直接优化学习目标。回答问题:1. 这两种方法的本质上是否是一样的(解空间是否相等)?比如说如果可以收敛到最优解,那么对于同一个问题它们一定会收敛到一样的情况?两者是不同的求解方法,而解空间(策略空间)不是由求解方法确定的,而是由策略模型确转载 2021-07-13 17:30:52 · 580 阅读 · 0 评论 -
聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut
转自:http://blog.csdn.net/abcjennifer/article/details/8170687聚类算法是ML中一个重要分支,一般采用unsupervised learning进行学习,本文根据常见聚类算法分类讲解K-Means, K-Medoids, GMM, Spectral clustering,Ncut五个算法在聚类中的应用。转载 2015-05-01 22:36:08 · 229 阅读 · 0 评论 -
特征向量的几何含义
来自http://fanhy298.blog.sohu.com/130363634.html长时间以来一直不了解矩阵的特征值和特征向量到底有何意义(估计很多兄弟有同样感受)。知道它的数学公式,但却找不出它的几何含义,教科书里没有真正地把这一概念从各种角度实例化地进行讲解,只是一天到晚地列公式玩理论——有个屁用啊。根据特征向量数学公式定义,矩阵乘以一个向量的结果仍是同维数的一转载 2015-05-01 22:57:57 · 283 阅读 · 0 评论