![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
qq_37032670
这个作者很懒,什么都没留下…
展开
-
机器学习自用阈值
梯度下降法特征缩放:尝试将所有特征的尺度都尽量缩放到-1 到1 之间梯度下降法学习率:α=0.01,0.03,0.1,0.3,1,3,10什么时候选择正规方程:需要计算,如果特征数量n较大则运算代价大,因为矩阵逆的计算时间复杂度为O(),通常来说当n小于10000 时还是可以接受的导数近似值中的ε:对梯度的估计采用的方法是在代价函数上沿着切线的方向选择离两个非常近的点然后计算两个点的平...原创 2018-08-13 22:46:53 · 2423 阅读 · 0 评论 -
EM算法
隐变量什么是隐变量呢,让我们先简单的说一下,我们估计算法在做的一些事情,我们要做的其实就是估算出概率模型的参数,概率模型是什么呢?你可以简单把它理解成一个分布,甚至说可以把它理解成一个函数,我们的估计算法就是为了求解出这些函数的参数而存在的。这边借用知乎上的一个例子,希望能够解释清楚隐变量是什么? 如果你站在这个人旁边,你目睹了整个过程:这个人选了哪个袋子、抓出来的球是什么颜色的。然后你把每...原创 2018-11-25 15:14:31 · 200 阅读 · 0 评论 -
机器学习中的线性代数
向量有时需要索引向量中的一些元素。在这种情况下,定义一个包含这些元素索引的集合,然后将该集合写在脚标处。比如,指定、 和,定义集合S={1,3,6},然后写作。用符号-表示集合的补集中的索引。比如表示x中除外的所有元素,表示x中除、 、外所有元素构成的向量。广播允许矩阵和向量相加,产生另一个矩阵:C=A+b,其中Cij=Aij+bj。也就是给矩阵A的每一行都加上向量b。那么这至少要求矩...原创 2018-11-27 23:12:26 · 140 阅读 · 0 评论