![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
擎子衿
欢迎大家指导
展开
-
《机器学习实战》基于概率论的分类方法:朴素贝叶斯
本章内容使用概率分布进行分类学习朴素贝叶斯分类器解析RSS源数据使用朴素贝叶斯来分析不同地区的态度朴素贝叶斯优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标称型数据。朴素贝叶斯是贝叶斯决策理论的一部分。贝叶斯决策理论的核心思想是:选择具有最高概率的决策。贝叶斯概率理论:贝叶斯概率引入先验知识和逻辑推理来处理不...原创 2019-12-17 09:00:43 · 182 阅读 · 0 评论 -
《机器学习实战》AdaBoost元算法提高分类性能
本章内容组合相似的分类器来提高分类性能应用AdaBoost算法处理非均衡分类算法所有分类器都会遇到一个问题:非均衡分类问题。将不同分类器组合起来的结果被称为集成方法或者元算法。AdaBoost优点:泛化错误率低,易编码,可以应用在大部分分类器上,无参数调整.缺点:对离群点敏感适用数据类型:数值型和标称型数据AdaBoost是基于错误提升分类器性能的算法单层决策树构建伪...原创 2019-12-10 16:43:04 · 237 阅读 · 0 评论 -
《机器学习实战》支持向量机
本章内容简单介绍支持向量机利用SMO进行优化利用核函数对数据进行空间转换将SVM和其他分类器进行对比有人认为,SVM是最好的现成的分类器,“现成”指的是分类器不加修改即可直接使用。同时,意味着在数据上应用基本形式的SVM分类器就可以得到低错误率的结果。SVM能够对训练集之外的数据点做出很好的分类决策。SVM有很多实现,先介绍最流行的一种实现,序列最小优化(Sequential Mi...原创 2019-12-04 18:20:59 · 73 阅读 · 0 评论 -
《机器学习实战》Logistic回归
本章内容Sigmoid函数和Logistic回归分类器最优化理论初步梯度下降最优算法数据中的缺失项处理Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式。 训练分类器时的做法就是寻找最佳拟合参数,使用的是最优化算法。Logistic 回归的一般过程(1)收集数据:采用任意方法收集数据。(2)准备数据:由于需要进行距离计算,因此要求数据类型为数值型。...原创 2019-11-29 11:08:11 · 350 阅读 · 0 评论 -
《机器学习实战》k-近邻算法
本章内容:k-近邻分类算法从文本文件中解析和导入数据使用Matplotlib创建扩散图k-近邻算法优点:精度高,对异常值不敏感,无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型k-近邻算法的一般流程(1)收集数据:可以使用任何方法(2)准备数据:距离计算所需要的数值,最好是结构化的数据格式。(3)分析数据:可以使用任何方式。(4)...原创 2019-11-22 09:57:55 · 172 阅读 · 0 评论 -
《机器学习实战》决策树(ID3算法)
参考博文(1)(2)本章内容(使用Python3.6实现)决策树简介 在数据集中度量一致性 使用递归构造决策树 使用matplotlib绘制树形图关于决策树,我们首先讨论构造决策树的方法,以及如何编写构造树的Python代码;接着提出一些度量算法成功率的方法;最后使用递归建立分类器,并且使用Matplotlib绘制决策树图。构造完成决策树分类器之后,我们将输入一些隐形眼睛的处方数据...原创 2019-11-01 21:44:28 · 927 阅读 · 0 评论 -
机器学习仓库(待更新)
UCI机器学习仓库UC Irvine Machine Learning Repository 是加州大学欧文学院机器学习数据集仓库,里面有大量的数据集,主要用于机器学习算法验证。链接...原创 2019-12-11 08:50:06 · 361 阅读 · 0 评论 -
《机器学习实战》NumPy函数库
NumPy函数库基础>>> from numpy import *>>> random.rand(4,4)array([[ 0.74535323, 0.9731331 , 0.24320585, 0.77917169], [ 0.82597332, 0.50762721, 0.56235416, 0.17493286], ...原创 2019-09-18 15:19:55 · 142 阅读 · 0 评论 -
机器学习算法归类(更新)
数据挖掘十大算法:C4.5决策树、K-均值(K-mean)、支持向量机(SVM)、Apriori、最大期望算法(EM)、PageRank算法、AdaBoost算法、k-近邻算法(KNN)、朴素贝叶斯算法(NB)、分类回归树(CART)算法。监督学习包括分类和回归预测问题,目标变量有两种类型:标称型和数值型。第一部分:分类1. K-近邻算法2. 决策树(ID3算法)3.朴...原创 2019-12-11 08:49:39 · 131 阅读 · 0 评论 -
深度学习、优化与识别(第1章 深度学习基础)
引言从第一代的深度前馈神经网络开始,随之而来的就有如下三个问题:1)可用训练数据量远小于模型中的参数量,容易出现过(欠)拟合现象;2)随着层级的增加,模型的优化目标函数呈现高度非凸性,由于待优化参数所在的可行域中存在着大量的鞍点和局部极小值点,所以参数初始化策略影响着网络模型的稳定性和收敛性;3)基于误差的反向传播算法越靠近输出层变化越大,越靠近输入层变化越小,这对通过梯度下降方式...原创 2019-08-29 15:44:22 · 315 阅读 · 0 评论