![](https://img-blog.csdnimg.cn/899c8b8bc456440d91c25f9d0f676b0c.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
啃书-机器学习实战
《机器学习实战》
Ethan-running
python、java后端,人工智能爱好者
展开
-
机器学习:SVM支持向量机理解
SVM应该是书中第一个特别复杂的算法了,其中大量的数学推导公式和优化算法,对小白真的太不友好了,估计很多要被SVM的数学公式给劝退的吧。这里就不做数学推导了,主要自己也推导不来,真的太难解释清楚了,尴尬。。。立个flag,有朝一日定手撕SVM算法!这篇文章的话主要是来了解一下SVM,涉及少量简单的公式。如果对SVM的推导公式有兴趣,网上有大量的推导文章可以参考。这里推荐一篇写的特别详细,特别好的...原创 2020-05-05 20:39:35 · 1471 阅读 · 0 评论 -
啃书-《机器学习实战》:线性回归
目录1 线性回归找最佳拟合直线2 局部加权线性回归3 示例:预测鲍鱼的年龄前面我们介绍了分类,分类的目标变量是标称型数据,而本章将会对连续型的数据做出预测,也就是我们的回归任务。1 线性回归找最佳拟合直线回归的目的是预测数值型的目标值。直接的办法是依据输入写出一个目标值的计算公式。假如你想要预测姐姐男友汽车的功率大小,可能会这么计算:这就是所谓的回归方程(regression equation),其中的0.0015和-0.99称作回归系数(regression weights),求这些回归系数的过原创 2020-05-30 15:41:14 · 421 阅读 · 0 评论 -
《机器学习实战》:非均衡分类问题(召回率/ROC/AUC/采样方法)
目录1正确率、召回率即ROC曲线分类不平衡问题是指,在一些分类问题中,我们关注的分类代价是不一样的。比前面章节中我们构建了一个用于检测患疝病的马匹是否存活的系统。假如某人给我们牵来一匹马,他希望我们能预测这匹马能否生存。,我们的分类器只有80%的精确率(accuracy)。 如果我们预测错误,那么我们将会错杀了一个如此昂贵的动物,更不要说人对马还存在情感上的依恋。这是我们啃个更希望不要错判。还有可能检测癌症时,患癌症的样本占比很少,可能只有1%,这是我们再用准确率衡量就会出现一些问题,比如我全部预测没有患原创 2020-05-27 20:23:49 · 875 阅读 · 0 评论 -
啃书-《机器学习实战》:AdaBoost算法
目录1 集成算法简介2 AdaBoost算法原理1 集成算法简介前面我们已经学了几种分类算法,但是往往单个分类器的效果并不是太好,这时就希望能够‘集思广益’,利用多个‘弱分类器’组成一个更大强大的分类器,这样分类效果就会更加可信、准确。集成算法主要有以下三类:1.Bagging自举汇聚法(bootstrap aggregating),也称为bagging方法,是在从原始数据集选择S次后得到S个新数据集的一种技术。新数据集和原数据集的大小相等。每个数据集都是通过在原始数据集中随机选择一个样本来进行替原创 2020-05-21 22:12:34 · 546 阅读 · 0 评论 -
啃书-《机器学习实战》:Logistic回归
目录1. 简介2. sigmoid函数3. 基于最优化方法的最佳回归系数确定3.1 梯度上升法3.2 训练算法:使用梯度上升找到最佳参数3.3 分析数据:画出决策边界3.4 训练算法:随机梯度上升4. 示例:从疝气病症预测病马的死亡率4.1 准备数据:处理数据中的缺失值4.2 测试算法:用 Logistic回归进行分类总结假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为佳拟合直线)...原创 2020-03-30 00:44:09 · 334 阅读 · 0 评论 -
啃书-《机器学习实战》:朴素贝叶斯
朴素贝叶斯1. 什么是朴素贝叶斯1.2 基于贝叶斯决策理论的分类方法1.2 条件概率1.3 使用条件概率来分类2. 使用朴素贝叶斯进行文档分类2.1 准备数据:从文本中构建词向量2.2 训练算法:从词向量计算概率2.3 测试算法2.4 词袋模型3. 使用朴素贝叶斯过滤垃圾邮件3.1 准备数据:切分文本3.2 测试算法:使用朴素贝叶斯进行交叉验证总结本章会给出一些使用概率论进行分类的方法。首先从...原创 2020-03-29 17:15:02 · 711 阅读 · 0 评论 -
啃书 -《机器学习实战》:决策树(ID3算法)
决策树1.决策树的构造1.1 信息增益1.2 划分数据集1.3 构建决策树2 测试和储存分类器2.1测试算法:使用决策树执行分类2.2 使用算法:决策树的存储3.总结我们经常使用决策树处理分类问题,决策树也是经常使用的数据挖掘算法。 它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。图3-1所示的流程图就是一个决策树,正方形代表判断模块 (dec...原创 2020-03-28 13:03:16 · 1493 阅读 · 0 评论 -
啃书 -《机器学习实战》:分类算法 K-近邻算法(KNN)
KNN算法1.概述2.一般流程3.KNN算法代码4.示例4.1使用 k-近邻算法改进约会网站的配对效果4.1.1解析数据4.1.2归一化数值4.1.3测试算法4.2手写识别系统4.2.1准备数据4.2.2测试算法5.总结KNN算法是本书中的第一个分类算法,也是最简单的算法之一。本文章对书中代码基于Python3做了少稍微的修改以电影分类举例,动作片中也会存在接吻镜头,爱情片中也会存在打斗场景,...原创 2020-03-22 14:40:11 · 551 阅读 · 0 评论