机器学习
大鹏小站
一个快乐敲代码的程序猿
展开
-
吴恩达机器学习(十一)——系统设计
一、构建垃圾邮件分类器举一个垃圾邮件分类的例子:假如你想建立一个垃圾邮件分类器,假设我们已经有一些加过标签的训练集。包括标注的垃圾邮件表示为y=1和非垃圾邮件表示为y=0。我们如何以监督学习的方法来构造一个分类器来区分垃圾邮件和非垃圾邮件呢?为了应用监督学习,我们首先必须确定的是如何用邮件的特征,构造向量x给出训练集中的特征x和标签y,我们就能够训练出某种分类器,比如用逻辑回归的方法。这...原创 2020-02-04 22:14:42 · 355 阅读 · 0 评论 -
吴恩达机器学习笔记(十八)——机器图片识别(应用实例)
第十八章 应用实例:图片文字识别(Application Example: Photo OCR)1、问题描述和流程图图像文字识别应用所作的事是,从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多。为了完成这样的工作,需要采取如下步骤:1.文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来2.字符切分(Character segmentati...原创 2020-02-28 20:05:04 · 1377 阅读 · 1 评论 -
吴恩达机器学习笔记(十七)——大规模机器学习
第十八章 大规模机器学习学习大数据集这一章中将讲述能够处理海量数据的算法。思考:为什么要使用海量数据集呢?要知道获取高性能的机器学习系统途径是采用低偏差的学习算法,并用大数据进行训练。这里拿之前提到过的易混淆词来举例,For breakfast I ate __ eggs,这里填two,而非too或者to,从下面的图中可以明确,只要使用大数据对算法进行训练,它的效果似乎会更好。从这样的...原创 2020-02-21 20:29:46 · 263 阅读 · 0 评论 -
吴恩达机器学习(十六)——推荐系统
前言目前生活中我们用的互联网产品就会都会涉及到推荐系统,比如逛淘宝时浏览商品时推荐系统会记下用户的喜好,然后推荐同类型或者觉得你感兴趣的商品给你;浏览新闻时根据你历史浏览的内容推荐同类型内容的新闻给你,这就是通俗意义上的推荐系统。一、基于内容的推荐系统1、问题描述假使我们是一个电影供应商,我们有 5 部电影和 4 个用户,我们要求用户为电影打分。前三部电影是爱情片,后两部则是动作片,我们可...原创 2020-02-19 21:53:52 · 314 阅读 · 0 评论 -
吴恩达机器学习(一)——监督学习和无监督学习
在理解监督学习和无监督学习之前,我们先来聊一聊什么是机器学习(ML)?机器学习:首先呢,学习可以称为一个举一反三的过程,举个栗子:我们在学生时代经常参加的考试,考试的题目在上考场前我们未必做过,但是在考试之前我们通常都会刷很多的题目,通过刷题目学会了解题方法,因此考场上面对陌生问题也可以算出答案。机器学习的思路也类似:我们可以利用一些训练数据(已经做过的题),使机器能够利用它们(解题方法)分...原创 2019-12-22 22:06:17 · 1331 阅读 · 0 评论 -
吴恩达机器学习(十五)——异常检测
问题动机模型建立再给定训练集的情况下,如何检测某一个输入x是否异常?首先要根据训练集数据建立一个模型,当给定数据的值的时候,则数据被认定为异常,表示它距离总体数据中心较远时被认定为正常。欺诈行为识别是异常识别最常用的领域,向量表示用户i的一系列特征,如登录次数,点击某一个页面的次数,发帖次数等,根据这些特征建立模型,然后根据阈值识别欺诈行为。同样,异常识别还用于产品检测等方面。高斯分...原创 2020-02-15 18:10:50 · 627 阅读 · 0 评论 -
吴恩达机器学习(十四)——降维
14.1动机一:数据压缩降维 也是一种无监督学习的方法,降维并不需要使用数据的标签。降维 的其中一个目的是 数据压缩,数据压缩不仅能够压缩数据,使用较少的计算机内存或磁盘空间,更可以加快我们的学习算法。降维 能很好的处理 特征冗余,例如:在做工程时,有几个不同的工程队,也许第一个工程队给你二百个特征,第二工程队给你另外三百个的特征,第三工程队给你五百个特征,一千多个特征都在一起,这些特征中往...原创 2020-02-11 21:08:38 · 608 阅读 · 0 评论 -
吴恩达机器学习(十三)——K-Means聚类算法
一、聚类思想 所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法,这个方法要保证同一类的数据有相似的特征,如下图所示:根据样本之间的距离或者说是相似性(亲疏性),把越相似、差异越小的样本聚成一类(簇),最后形成多个簇,使同一个簇内部的样本相似度高,不同簇之间差异性高。二、k-means聚类分析算法相关概念:K值:要得到的簇的个数质心:每个簇的均值向量...原创 2020-02-11 16:25:23 · 1559 阅读 · 0 评论 -
吴恩达机器学习笔记(十二)——支持向量机
SVM与神经网络支持向量机并不是神经网络,这两个完全是两条不一样的路吧。不过详细来说,线性SVM的计算部分就像一个单层的神经网络一样,而非线性SVM就完全和神经网络不一样了(是的没错,现实生活中大多问题是非线性的),详情可以参考知乎答案。这两个冤家一直不争上下,最近基于神经网络的深度学习因为AlphaGo等热门时事,促使神经网络的热度达到了空前最高。毕竟,深度学习那样的多层隐含层的结构,犹如一...原创 2020-02-08 19:22:01 · 831 阅读 · 0 评论 -
吴恩达机器学习(十)——诊断法、偏差与方差、欠拟合与过拟合
在前几周的课程里,我们已经学习了 监督学习 中的 线性回归、逻辑回归、神经网络。回顾课程作业,所有的样本数据都被用来训练模型。验证模型时,也只是将模型的数据结果与正确结果作对比来看正确率。 这样的训练方法是否正确?正确率是否能作为评价模型的标准?将学习如何评价我们的模型,以及如何采取正确有效的改进策略。点击 课程视频 你就能不间断地学习 Ng 的课程,关于课程作业的 Python 代码已经放到了...原创 2020-01-31 18:47:02 · 437 阅读 · 0 评论 -
吴恩达机器学习(八)——神经网络模型
一、非线性假设(神经网络模型)下面几个例子来阐述神经网络算法的目的,这几个问题的解决都依赖于研究复杂的非线性分类器。考虑这个监督学习分类的问题,我们已经有了对应的训练集,如果利用逻辑回归算法来解决这个问题。首先需要构造一个包含很多非线性项的逻辑回归函数。事实上,当多项式项数足够多时,那么可能你能够得到一个,分开正样本和负样本的分界线, 当只有两项时,比如 x1、x2 这种方法确实能得到不错...原创 2020-01-29 17:42:22 · 1122 阅读 · 0 评论 -
吴恩达机器学习(七)——正则化
一、防止过度拟合过度拟合问题:例如:那个用线性回归来预测房价的例子,我们通过建立以住房面积为自变量的函数来预测房价,我们可以对该数据做线性回归,以下为三组数据做线性拟合的结果:①第一个图我们用直线去拟合,这不是一个很好的模型。我们看看这些数据,很明显,随着房子面积增大,住房价格的变化应趋于稳定,或者越往右越平缓。因此该算法没有很好拟合训练数据,我们把这个问题称为欠拟合(underfit...原创 2020-01-28 17:23:56 · 392 阅读 · 0 评论 -
一篇文章讲清人工智能、机器学习和深度学习的区别与联系
人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。为了帮助大家更好地理解人工智能,这篇文章用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对刚入门的同行有所帮助。人...原创 2017-12-01 18:34:26 · 371 阅读 · 0 评论 -
吴恩达机器学习(四)——多变量线性回归
1. Multiple features(多维特征)我们提到过的线性回归中,我们只有一个单一特征量(变量)——房屋面积x。我们希望使用这个特征量来预测房子的价格。我们的假设在下图中用蓝线划出:不妨思考一下,如果我们不仅仅知道房屋面积(作为预测房屋价格的特征量(变量)),我们还知道卧室的数量、楼层的数量以及房屋的使用年限,那么这就给了我们更多可以用来预测房屋价格的信息。即,支持多变量...原创 2020-01-12 22:37:24 · 635 阅读 · 0 评论 -
吴恩达机器学习(五)——octave教程
https://blog.csdn.net/benzhujie1245com/article/details/82762455原创 2020-01-11 18:48:34 · 302 阅读 · 0 评论 -
吴恩达机器学习(二)——代价函数
吴老师通过房价的例子深入浅出的讲解代价函数,视频中的代价函数就是为了求最接近房价数据的函数参数。房价模型的代价函数代价函数有助于我们弄清楚如何把最有可能的函数与我们的数据相拟合。比如在模型训练中我们有训练集(x,y),x表示房屋的面积,y表示房屋的价格,我们要通过线性回归得到一个函数hθ(x)(被称为假设函数),以x作为自变量,y作为因变量,用函数来预测在给定的房屋面积下的价格。...原创 2020-01-05 23:11:36 · 410 阅读 · 0 评论