机器学习
共觞
潜龙勿用,见龙在田。
展开
-
机器学习算法的基础(使用Python和R代码)之 概述
以下内容翻译于Essentials of Machine Learning Algorithms (with Python and R Codes)很早以前就看过,当时没来得及翻译。今天稍微翻译一下,方便以后学习的盆友。机器学习算法概述从广义上讲,有3种类型的机器学习算法1.监督学习工作原理: 该算法由目标/结果变量(或因变量)组成,该变量将从给定的一组预测变量(自变量)中预测。使...翻译 2019-04-18 20:31:58 · 254 阅读 · 0 评论 -
机器学习算法的基础(使用Python和R代码)之 线性回归
1.线性回归它用于基于连续变量估计实际价值(房屋成本、通话次数、总销售额等)。在这里,我们通过拟合一条最优直线来建立自变量和因变量之间的关系。这条最合适的直线被称为回归线,它由一个线性方程Y= a *X + b表示。理解线性回归最好的方法是重温童年的这种经历。让我们假设,你让一个五年级的孩子按照体重的增加顺序来安排班级里的人,而不是问他们的体重。你认为这个孩子会如何做?他/她可能会观察(视觉...翻译 2019-04-18 21:02:53 · 426 阅读 · 0 评论 -
机器学习算法的基础(使用Python和R代码)之 逻辑回归
2. Logistic回归不要被它的名字搞混了!它是一个分类而不是回归算法。它用于根据给定的自变量集估计离散值(二进制值,如0/1、yes/no、true/false)。简单地说,它通过将数据拟合到 logit 函数来预测事件发生的概率。因此,它也被称为 logit 回归。因为它预测了概率,所以它的输出值在0到1之间(如预期的那样)。再次,让我们通过一个简单的例子来尝试理解这一点。假设你的...翻译 2019-04-18 21:50:50 · 460 阅读 · 0 评论 -
机器学习算法的基础(使用Python和R代码)之 决策树
这是我最喜欢的算法之一,我经常使用它。它是一种监督学习算法,主要用于分类问题。令人惊讶的是,它既适用于分类因变量(离散型),也适用于连续因变量。在该算法中,我们基于最重要的属性/独立变量来将总体分成两个或更多个同类集,以尽可能地作为不同的组。有关更多详细信息,请参阅: 简化决策树。在上图中,您可以看到人口根据多个属性分为四个不同的组,以确定 “ 他们是否会玩 ”。为了将群体分成不同的异构群体...翻译 2019-04-19 15:47:06 · 223 阅读 · 0 评论 -
机器学习 支持向量机 --简单介绍
前言我第一次听到“支持向量机”这个名字,我觉得,如果这个名字本身听起来那么复杂,那么这个概念的表述将超出我的理解范围。幸运的是,我看到了一些大学讲座视频,并意识到这个工具是多么简单有效。在本文中,我们将讨论支持向量机如何工作。本文适合那些对此算法知之甚少且对学习新技术有好奇心的读者。在以下文章中,我们将详细探索该技术,并分析这种技术强于其他技术的案例。什么是分类分析?让我们考虑一个例子来理...翻译 2019-04-19 16:57:18 · 1087 阅读 · 0 评论 -
机器学习算法的基础(使用Python和R代码)之 SVM
SVM(支持向量机)这是一种分类方法。在此算法中,我们将每个数据项绘制为n维空间中的点(其中n是您具有的要素数),每个要素的值是特定坐标的值。例如,如果我们只有两个特征,如个体的高度和头发长度,我们首先在二维空间中绘制这两个变量,其中每个点有两个坐标(这些坐标称为支持向量)现在,我们将找到一些在两个不同分类的数据组之间分割数据的行。这将是这样的线,使得距离两组中的每一组中的最近点的距离...翻译 2019-04-19 19:44:54 · 659 阅读 · 0 评论