机器学习
文章平均质量分 92
吴恩达
饮尽夏日
这个作者很懒,什么都没留下…
展开
-
机器学习(七)
监督学习算法:线性回归、逻辑回归、 神经网络以及支持向量机无监督学习算法:K-均值聚类算法,主成分分析法来进行降维,以及异常检测算法(这个算法有时也可以用一些带标签的数据来对算法进行评估)特定应用和话题:推荐系统、大规模机器学习系统、MapReduce、滑动窗口分类器。原创 2023-10-04 22:51:00 · 52 阅读 · 1 评论 -
机器学习(六)
特征对机器学习来说是非常重要的,你所选择的特征对学习算法的性能有很大的影响。的式子中的平方误差项的求和是所有用户j的总和和所有被该用户评分过的电影的总和,这其实是把所有(i,j)对全加起来,每项对应被某一用户评分过的某一电影。的式子中则是进行相反的运算,它表示对于每部电影i,将所有对它评分过的用户j求和,这两个求和运算都是对所有r(i,j)=1的(i,j)对求和。我将提取所有的电影的特征,然后逐行的写入矩阵中。协同过滤算法指的是,当你执行算法时要观察大量的用户,观察这些用户的实际行为,来协同地得到更佳的。原创 2023-10-04 18:14:22 · 48 阅读 · 1 评论 -
机器学习(五)
是有非常高的维度的比如说10000维的特征向量,在实际中这可能是计算机视觉的问题,对于这种高维向量,运行学习算法时将变得非常慢,假如你要使用10000维的特征向量进行logistic回归,或者输入神经网络,或者支持向量机,或其他你想要的操作,因为数据量太大,将会使得你的学习算法运行速度非常慢,此时用PCA算法可以减少数据的维度从而使得算法运行更加高效。这也是无监督学习的一部分,数据没有标签,因此并不总是有一个明确答案,也因为这个原因,用一个自动化的算法,来选择聚类数量是很困难的。数据中心的计算机监控等等。原创 2023-10-03 20:19:38 · 30 阅读 · 0 评论 -
机器学习(四)
其中一种典型的分割方法是按照7:3的比例,将70%的数据划为训练集,将30%的数据划为测试集,用m表示训练样本的总数,而m_test表示测试集样本的总数。在得到学习参数后,如果你将假设函数放到一组新的房屋样本上进行测试,假如说你发现在预测房价时,产生了巨大的误差,现在你的问题是想要改进这个算法需要怎么办?还有另一种形式的测试度量,可能更易于理解,叫做错误分类,也被称为0/1分类错误,0/1表示了你预测的分类是正确或错误的情况。这通常也能告诉你,想要改进一种算法的效果,知道什么样的改进才是有意义的。原创 2023-10-01 14:54:12 · 28 阅读 · 0 评论 -
机器学习(二)
以下讨论一种新的线性回归的版本,这种形式适用于多个变量或者多特征量的情况。如何使用梯度下降法来处理多元线性回归?如何设定该假设的参数?原创 2023-09-24 10:51:01 · 36 阅读 · 1 评论 -
机器学习(三)
视频课提到但没有详细解释的算法,如果选择使用这三个算法中的任何一个,都不需要手动选择学习率α。因为这些算法有一个“智能内循环",称为线性搜索算法,它可以自动尝试不同的学习速率α并自动选择好的学习速率α,它甚至可以为每次迭代选择不同的学习速率。原创 2023-09-28 10:37:27 · 32 阅读 · 0 评论 -
机器学习(一)
(1959)Arthur Samuel对机器学习的定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域。[跳棋程序](1998)Tom Mitchell对机器学习的定义:计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P。通过P测定在T上的表现因经验E而提高。原创 2023-09-23 12:10:57 · 39 阅读 · 0 评论