![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习算法
tags
主要研究大数据计算平台以及应用算法。
展开
-
k-近邻算法
k-近邻算法标签: 机器学习实践1. k-近邻算法概述KNN的特点: 优点 缺点 适用范围 精度高、对异常值不敏感、无数据输入假定 计算复杂度高、空间复杂度高 数值型和标称型(离散型数据,变量结果只在有限目标集合中取值) 工作原理: 存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后原创 2015-11-11 09:20:57 · 845 阅读 · 0 评论 -
决策树
一、决策树的构造 决策树 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 缺点:可能会产生过度匹配问题 使用数据类型:数值型和标称型 在构造决策树时,我们需要解决的第一个问题是,当前数据集上哪个特征在划分数据分类时起决定性作用。为了找到决定性的特征,划分出最好的结果,我们必须评估每个特征。完成测试之后,原始数据集被划分为几个数据子集。这些数据子集会原创 2016-02-28 19:42:40 · 1040 阅读 · 0 评论