![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
xyz2107605729
这个作者很懒,什么都没留下…
展开
-
机器学习实战之机器学习基础
什么是机器学习:把无序的数据转换为有用的信息利用计算机来揭示数据背后的真实含义监督学习一般使用两种类型的目标变量(结果的两种表达形式):标称型和数值型。标称型目标变量的结果只在有限目标集中取值,如真与假、动物分类的集合{爬行类,鱼类,哺乳类,两栖类},标称型主要用于分类;数值型变量则可以从无限的数值集合中取值,如0.1、1.0000、10、1000等。数值型主要用于回归分析...原创 2018-03-30 21:59:12 · 209 阅读 · 0 评论 -
机器学习之K近邻算法
K-Nearest Neighbors(KNN)将新数据的每一个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据的分类标签(最近邻的样本)优点:精确度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高。保存每个数据,计算每个数据,无法给出平均实例样本和典型事例样本有什么特征适用数据范围:数值型和标称型K-近邻算法的一般流程1、收集数据。2...原创 2018-03-31 14:59:03 · 221 阅读 · 0 评论 -
机器学习实战之决策树
决策树构造决策树时,要解决的问题是,当前数据集上哪个特征在划分数据集分类时起决定性作用。为找到决定性特征,要评估每个特征。完成评估后,原始数据集被划分为几个数据子集,这些子集分布在第一个决策点的所有分支。若某分支下的数据属于同一类型,则该分支下的数据完成分类,若数据子集内的数据不属于同一类,则重复上述划分子集的过程(递归)优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以...原创 2018-04-01 18:57:10 · 147 阅读 · 0 评论