机器学习
文章平均质量分 91
阿肉~
这个作者很懒,什么都没留下…
展开
-
【机器学习】支持向量机SVM识别谁发了邮件
开始本章的项目之前,请先阅读[机器学习]一看就懂的教程:支持向量机SVM,先花10分钟了解一下SVM是什么项目介绍:每个人都有自己的常用语,本项目会给你两个人的邮件文本内容,分别是Sarah和Chris,分析他们的常用语。然后再给你一封没有发件人的邮件,通过邮件的正文内容从而预测是谁发送的文章?不用担心,邮件的内容我们已经处理好了,把数据分成训练数据和测试数据也都分好了,所有你需要做的就是,写...原创 2019-01-12 15:12:18 · 275 阅读 · 0 评论 -
【机器学习】一看就懂的教程:支持向量机SVM
支持向量机SVM的翻译为Support Vector Machine,但是实际上跟machine机器没有什么关系,只是起了个这个名字。SVM是1963年提出了,提出之后就得到了非常广泛的应用,因为它是做监督分类的一个非常好的手段。搓搓手一起来学习吧~~好的分割线什么才是好的分割线?如果是下面这样的样本集合那么答案很简单,“/”这样的一条线就是最好的分割线那么如果现在给你的是这样的一个数据集...原创 2019-01-11 14:47:03 · 1129 阅读 · 0 评论 -
【机器学习】一看就懂的教程:决策树
在机器学习中,监督分类(自己先选定好特征参数)有朴素贝叶斯,支持向量机SVM,还有决策树。对于前两个,可以看下面两篇文章复习:[机器学习]一看就懂的教程:朴素贝叶斯[机器学习]一看就懂的教程:支持向量机SVM决策树,听名字就知道很简单,所以这个算法我也是非常简单的过一下构建决策树 Decision Trees下图的样本,通过决策树,要进行三次分割代码是十分简单#导入模块from ...原创 2019-01-13 16:52:26 · 549 阅读 · 1 评论 -
线性回归中的最小二乘法和梯度下降法比较
为什么要比较这两种方法呢?很多人可能不知道,我先简单的介绍一下机器学习有两种,一种是监督学习,另一种是非监督学习。监督学习就是我告诉计算机你把班上同学分个类,分类标准是按照性别,男生和女生;非监督分类就是告诉计算机你自己去把班上同学分个类吧,我不告诉你分类标准。在监督学习中,如果我们面对的变量是连续型的变量就要用到回归回归其实是非常容易理解,也非常实用的一种方法,很多经济类的学生在写论文的...原创 2019-01-18 17:22:56 · 10728 阅读 · 4 评论 -
【机器学习】 遇到异常值怎么办?
文章目录异常值如何处理异常值不管是机器学习还是数据分析,只要你面对一大堆数据,总是免不了出现异常值的可能性,那么遇到这些异常值,我们该如何让处理捏?异常值假设下图的数据集中,右上角有一个异常值。假设我们不对异常值做任何的处理,直接进行回归操作,那么最后得到的很有可能就是第一条线的回归方程,虽然我们觉得最后一条线看起来更简单更符合我们的期望那么异常值是哪里来的呢?异常值可能是由于传感器的...原创 2019-01-25 15:10:08 · 1351 阅读 · 0 评论 -
优达学诚--对安然事件数据集的分析
本篇文章旨在通过对安然事件数据集的分析教会大家面对一个数据集,应该如何下手安然事件造成有史以来最大的公司破产。在2000年度,安然是美国最大的能源公司,然而被揭露舞弊后,它在一年内就破产了。我们之所以选择使用安然事件的数据集来做机器学习的项目,是因为我们已经有安然的电子邮件数据库,它包含150名前安然员工之间的50万封电子邮件,主要是高级管理人员。这也是唯一的大型公共的真实邮件数据库。感兴趣...原创 2019-01-25 15:55:24 · 2500 阅读 · 0 评论 -
优达笔记-安然数据分析 异常值处理
安然事件,作为美国最大的欺诈案,也是破产案,不仅在经济法律领域有很重要的意义,它所保留下来的关于高管及员工的工资、邮件、股权等等的真实数据对于想要学习机器学习的人来说也是非常好的材料上一篇文章我们讲了如何查看数据,包括查看这些数据有那些特征,每个人的数据是什么,如何查看NaN值等,需要回归的可以再看两眼哦[机器学习] 美国最大欺诈案—对安然事件数据集的分析(一)本篇文章主要是对安然事件数据的异...原创 2019-01-25 18:48:50 · 771 阅读 · 0 评论 -
【机器学习】非监督学习初探—聚类
文章目录非监督学习聚类K-均值 (K-Means)Sklearn中的K-均值非监督学习机器学习有两种,一种是监督学习,另一种是非监督学习。监督学习就是我告诉计算机你把班上同学分个类,分类标准是按照性别,男生和女生;非监督分类就是告诉计算机你自己去把班上同学分个类吧,我不告诉你分类标准。没有分类标准该如何分类呢?这就需要引入一个新的方法:聚类(Clustering)聚类有两个人,一个叫做S...原创 2019-01-26 16:38:58 · 680 阅读 · 0 评论 -
优达笔记-特征缩放
文章目录特征缩放在Python中实践特征缩放特征缩放特征缩放这个名字听起来很腻害的样子,实际上它讲了一个非常浅显的方法。例如下面的Cameront1身高5.9,体重175,他穿L号的衣服。Sarah体重115,身高5.2,她穿S号的衣服。那么有个人叫Chris,他体重140,身高6.1,应该穿了L还是S呢?我们可以合理的猜测一下,Chris的身高6.1更接近Cameron的5.9的身...原创 2019-01-28 14:24:28 · 337 阅读 · 0 评论