![](https://img-blog.csdnimg.cn/20210816092137578.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
《机器学习实战》笔记
文章平均质量分 93
依托于《机器学习实战》书籍,图灵程序设计丛书,中国工信出版社2020年11月第42次印刷。此为个人学习书籍的总结与见证。
Sinking Stone
为什么乌鸦像写字台
展开
-
机器学习实战第六章
支持向量机 说明:本章节所有代码使用版本为Python3 优点:泛化错误率低,计算开销不大,结果易解释 缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题 适用数据类型:数值型和标称型数据 (有人说)SVM是最好的现成的分类器,“现成”是指分类器不加修饰即可直接使用。这也就意味着数据上应用基本的SVM分类器就可以得到低错误率的结果。SVM对训练集之外的数据点做出很好的分类决策。 基于最大间隔的分隔数据 两组数据分隔的足够开,很容易用一条直线将两组数据点分开,这组数据被原创 2021-08-17 23:04:53 · 295 阅读 · 0 评论 -
机器学习实战第五章
Logistic回归 说明:本章节所有代码使用版本为Python3 优点:计算代价不高,易于理解和实现 缺点:容易欠拟合,分类精度可能不高 适用数据类型:数值型和标称型数据 这是最优化算法。主要思想是:根据现有的数据对分类边界线建立回归公式,以此进行分类。“ 回归 ”一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器识的做法就是寻找最佳拟合参数。 Logistic回归的一般过程 收集数据:采用任意方法收集数据 准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则原创 2021-08-15 20:44:31 · 262 阅读 · 0 评论 -
机器学习实战第四章
基于概率论的分类方法:朴素贝叶斯 说明:本章节所有代码使用版本为Python3 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 适用数据类型:标称型 概率论是许多机器学习算法的基础。本文首先从一个最简单的概率分类器开始,然后给出一些假设来学习朴素贝叶斯分类器,之所以称为 “朴素” ,是因为整个形式化过程只做最原始、最简单的假设。我们充分利用Python的文本处理能力将文档切分成词向量,然后利用词向量对文档进行分类,还将构建一个分类器,观察其在真实的垃圾原创 2021-08-09 08:30:04 · 558 阅读 · 0 评论 -
机器学习实战第三章
决策树 说明:本章节所有代码使用版本为Python3 优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关特征数据 缺点:可能会产生过度匹配问题 适用数据类型:数值型和标称型 解释: 标称型:标称型目标变量的结果只在有限目标集中取值,比如真与假(标称型目标变量主要用于分类) 数值型(连续型):数值型目标变量则可以从无限的数值集合中取值 决策树经常用于解决处理分类问题,它的一个重要任务是为了理解数据中所蕴含的知识信息,因此决策树可以使用不熟悉的数据集并从中提取出一系列原创 2021-08-07 21:12:52 · 586 阅读 · 0 评论