AI
IAMITPRO
微信公众号|今日头条号|知乎|简书:首席IT民工
展开
-
机器学习笔记 第1课:机器学习中的数据
数据在机器学习中起着重要的作用。 在谈论数据时,理解和使用正确的术语非常重要。 你如何看待数据?想想电子表格吧,有列、行和单元格。 从统计视角而言,机器学习的任务是在假设函数( f )的上下文中构建数据。这些假设函数由机器学习算法通过学习建立。给定一些输入变量( Input ),该函数回答了预测输出变量( Output )是什么的问题。 输出= f (输入) 输入和输出可以称为变量或向量。...原创 2018-09-17 18:39:27 · 207 阅读 · 0 评论 -
机器学习笔记 第2课:适用于所有算法的原则
机器学习中的监督学习算法,常常用于预测建模。这些算法有一个共通的原则。 人们一般这样来描述机器学习算法:学习一个目标函数(f),能够最好地将输入变量(X)映射到输出变量(Y)。 Y = f(X) 这是一个常见的学习任务。我们期望在给定新的输入变量(X)时,对(Y)做出预测。 我们并不知道函数(f)长什么样,或是什么形式。 倘若我们知道,大可直接使用,也就不需要使用机器学习算法从数据中进行学习。...原创 2018-09-18 18:51:30 · 143 阅读 · 0 评论 -
机器学习笔记 第3课:参数算法和非参数算法
什么是参数机器学习算法?它与非参数机器学习算法有何不同? “假设”通常会大大简化学习过程,但也会限制学到的东西。将函数简化为已知形式的算法,称为参数机器学习算法。 它包括两个步骤: 选择函数的形式。 从训练数据中学习该函数的系数。 常见的参数机器学习算法是线性回归和逻辑回归。 相反地,不对映射函数的形式做出有力假设的算法,称为非参数机器学习算法。通过不作出任何假设,它可以自由地从训练数据...原创 2018-10-02 08:52:50 · 585 阅读 · 0 评论 -
机器学习笔记 第4课:偏差,方差和权衡
经由偏差 - 方差的权衡,我们可以更好地理解机器学习算法。 偏差(bias)是模型所做的简化假设,其目的是更容易地学习目标函数。 通常,参数算法具有高偏差。它们学习起来很快,且易于理解,但通常不太灵活。反过来,它们对复杂问题的预测性能较低,无法满足算法偏差的简化假设。 决策树是一种低偏差算法,而线性回归则是一种高偏差算法。 方差(variance)表示的是,如果使用不同的训练数据,目标函数...原创 2018-10-03 20:46:00 · 269 阅读 · 0 评论 -
机器学习笔记 第5课:线性回归算法
线性回归可能是统计学和机器学习中最知名且易于理解的算法之一。 它不就是一项起源于统计学的技术吗? 预测建模主要关注的是让模型的误差最小化,或者说,在可以解释的前提下,尽可能作出最准确的预测。我们会借用,重用,甚至是窃取许多不同领域(包括统计学)的算法,并将其用于上述的目标。 线性回归通常表示为这样一个等式: 通过查找特定的称为系数(B)的输入变量的权重,来描述最符合输入变量(x)和输出变量...原创 2018-10-08 18:02:20 · 211 阅读 · 0 评论 -
机器学习笔记 第6课:逻辑回归算法
逻辑回归是机器学习从统计领域借用的又一项技术。它是二元分类问题(即只有两种类型的分类问题)的首选方法。 逻辑回归和线性回归的类似之处在于,其目标是找到每个输入变量的权重系数。 与线性回归的不同点是,逻辑函数是非线性函数,逻辑回归使用非线性的逻辑函数对输出结果进行转换。 逻辑函数看起来像一个大S,能够将任何值转换为0到1的范围。 这很有用,因为我们可以对逻辑函数的输出应用一...原创 2018-10-30 19:02:12 · 278 阅读 · 0 评论 -
机器学习笔记 第7课:线性判别分析算法
逻辑回归是一种传统的分类算法,仅限于两类分类问题。 如果你有两个以上的类,那么线性判别分析算法是首选的线性分类技术。 线性判别分析法简称LDA,表示起来非常简单。 它包含你的数据经由每个类计算之后的统计属性。 对于单个输入变量,这包括: 每个类别的平均值。 对所有类别计算的方差。 通过计算每个类的判别值,并对具有最大值的类进行预测,从而做出完整的预测。这项技术假设数据具有高斯分布(钟形曲线...原创 2018-11-06 18:29:05 · 434 阅读 · 0 评论 -
机器学习笔记 第8课:分类和回归树
决策树是机器学习中用于预测建模的一种重要的算法类型。 决策树模型的表现形式是二叉树。实际上,它就是算法和数据结构中的二叉树,没什么太花哨的。 每个节点代表一个输入变量(x)和该变量上的分支(这里假设是数字类型的变量)。 树的叶节点包含用于进行预测的输出变量(y)。 通过不断遍历树的各个分支,最终到达某个叶节点,并在该叶节点处输出要预测的类别值。 决策树的学习过程很短,预测速度非常快。 对...原创 2018-11-27 19:02:55 · 408 阅读 · 0 评论 -
机器学习笔记 第9课:朴素贝叶斯算法
朴素贝叶斯(Naive Bayes)是一种既简单又强大的预测建模算法。 该模型由两种类型的概率组成,可以直接从你的训练数据中计算出来: 每个类别的概率 给定x值的条件下,每个类别的条件概率 经由概率计算,该模型可以基于贝叶斯定理,对新的数据进行预测。 对于类型为实数的数据,我们通常假设这些数据呈现高斯分布(钟形曲线),以便轻松地估算其概率。 朴素贝叶斯之所以称作朴素,是因为它假设每个...原创 2018-11-27 19:38:03 · 408 阅读 · 0 评论