机器学习--吴恩达
翔燕
这个作者很懒,什么都没留下…
展开
-
吴恩达机器学习——一元线性回归(1)
1.课程部分1.1 基本概念(1)训练集—由训练样例(training example)组成的集合就是训练集(training set),其中(x,y)是一个训练样例,(x(i),y(i))是第i个训练样例。(2)假设函数—用学习算法对训练集数据训练,可以得到假设函数(Hypothesis Function),单变量线性回归的假设函数为:h_θ (x)=θ_0+θ_1 x, 为了方便h_θ ...原创 2019-08-26 22:12:55 · 356 阅读 · 0 评论 -
吴恩达机器学习—大规模机器学习(14)
1. 大型数据集的学习在低方差的模型情况下增加数据集的规模可以帮助获得更好的结果。当数据集很大,是个多达100 万条记录的训练集时的应对方法。如果采用之前学习的批量梯度下降,每一次梯度下降迭代,都需要计算训练集的误差的平方和,计算代价非常大。面对大规模训练集时,首先应该做的事是:绘制学习曲线来帮助判断去检查这么大规模的训练集是否真的必要。必须要大规模的数据时候,批量梯度下降方法不再适应,需要使...原创 2019-09-09 17:30:43 · 121 阅读 · 0 评论 -
吴恩达机器学习—推荐系统(13)
1. 基于内容的推荐系统(1)推荐系统的应用很广泛:1)电子商务:根据客户购买和浏览商品推荐相关商品2)电影和视频推荐:根据视频浏览记录,喜好推荐3)音乐电台的推荐4)网页及新闻:推荐根据网页浏览记录,推荐相关新闻和网页5)社交网络:推荐好友,信息流的会话推荐6)广告推荐等(2)电影推荐举例电影资讯网站,用户对于电影的打分(1 - 5 分),代表用户没有评价过该电影,数据,对于每...原创 2019-09-09 17:33:54 · 161 阅读 · 0 评论 -
吴恩达机器学习—降维(11)
1. 概述希望有足够多的特征(知识)来保准学习模型的训练效果,但高维的特征也有几个如下不好的地方:学习性能下降,知识越多,吸收知识(输入),并且精通知识(学习)的速度就越慢;过多的特征难于分辨,很难第一时间认识某个特征代表的意义特征冗余特征降维的一般手段就是将高维特征投影到低维空间。降维的作用:数据压缩和数据可视化。例子:2D---->1D 3D------>2D...原创 2019-09-09 17:34:11 · 234 阅读 · 0 评论 -
吴恩达机器学习——支持向量机SVM(9)
1. 代价函数其中:C=1λC=\frac{1}{λ}C=λ1;cost0=−log(1−11+e−z)==−log(1−11+e−θTx)cost_0 = -log(1- \frac{1}{1+e^{-z}})== -log(1- \frac{1}{1+e^{-θ^Tx}})cost0=−log(1−1+e−z1)==−log(1−1+e−θTx1); cost1=−log(111+...原创 2019-09-09 17:30:59 · 4726 阅读 · 0 评论 -
吴恩达机器学习—聚类(10)
1. 无监督学习在机器学习中,无监督学习可以被简单理解为不为训练集提供对应的类别标识。无监督学习(Unsupervised Learning)下的训练集:(x(1)),(x(2)),(x(3))2. 聚类在监督学习中,把对样本进行分类的过程称之为分类(Classification),而在无监督学习中,将物体被划分到不同集合的过程称之为聚类(Clustering)。在聚类中,把物体所在的集...原创 2019-09-09 17:33:24 · 268 阅读 · 0 评论 -
吴恩达机器学习——机器学习系统设计(8)
1. 误差分析(1)构建一个学习算法的推荐方法从一个简单的能快速实现的算法开始,实现该算法并用交叉验证集数据测试这个算法绘制学习曲线,决定是增加更多数据,或者添加更多特征,还是其他选择进行误差分析:人工检查交叉验证集中我们算法中产生预测误差的实例,看看这些实例是否有某种系统化的趋势(2)误差分析作用误差分析并不一定能判断应该采取怎样的行动。但通过尝试不同的模型并比较后,能用数值来判...原创 2019-09-09 17:32:11 · 4333 阅读 · 0 评论 -
吴恩达机器学习--机器学习经验方法总结(7)
1. 问题引入当测试假设函数发现有很大的误差,一般的改进方法为:使用更多的训练样例减少特征数增加特征数增加多项式特征减小λ 的值增加λ 的值但并不是所有的方法都有用,需要分析知道哪里出了问题。2. 模型评估为了能有效地评估我们的模型,先要将数据集分成训练集(training set)(占原数据的70%),和测试集(test set)(占原数据的30%)。在数据集分割时,...原创 2019-09-09 17:34:32 · 3588 阅读 · 0 评论 -
吴恩达机器学习—异常检测(12)
1. 异常检测定义和使用给定正常的数据集原创 2019-09-09 17:32:25 · 203 阅读 · 0 评论 -
吴恩达机器学习--神经网络Ⅰ(5)
1 为什么要用神经网络实际问题往往有很多特征,成千的特征会带来两个问题:一是过拟合,二是消耗大量计算资源。模型复杂度为O(n2,n3)或者更高。在计算机视觉中,一张图片对于计算机来说就是一堆数字矩阵,对图片处理时有成千上万的特征,对于这类问题使用logistic回归是没法解决的,这个时候就要用到神经网络(Neural Network)。2 神经网络...原创 2019-09-09 17:35:26 · 1138 阅读 · 2 评论 -
吴恩达机器学习---逻辑回归(3)
1 应用在分类问题中,你要预测的变量原创 2019-09-09 17:34:55 · 555 阅读 · 0 评论 -
吴恩达机器学习---多变量线性回归(2)
1)多变量线性回归的假设函数,损失函数,以及梯度下降和正规方程的使用。2)学习率的选择。3)梯度下降的时候的特征处理方法的介绍。4)采用正规方程求解的时候,关于矩阵不可逆情况的原因和处理介绍。原创 2019-09-09 17:31:40 · 186 阅读 · 0 评论 -
吴恩达机器学习--正则化(4)
1 过拟合(1)回归中的过拟合第一个模型是欠拟合,不能很好地适应训练集;第三个模型用四次方进行拟合,过于强调拟合原始数据,而丢失了预测新数据的能力。而中间的模型似乎最合适。(2)分类问题中的过拟合原创 2019-09-09 17:33:09 · 228 阅读 · 0 评论 -
吴恩达机器学习—应用实例:图片文字识别(15)
1. 问题描述和流程图有一张图片,要求识别图片中的所有字符工作流程是:1)文本检测(将图片扫描一遍):获得包含了文本的文本框2)字符分割:从文本框中分割出各个字符3)字符分类(识别):字符分割中得到的只是一个个字符图形,在字符分类阶段,才能真正知道该字符类别。步骤:1.文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来2.字符切分(Character...原创 2019-08-30 20:03:30 · 661 阅读 · 0 评论