各种分类算法比较

最新推荐文章于 2024-03-13 15:57:03 发布

VIP文章 troubleisafriend

最新推荐文章于 2024-03-13 15:57:03 发布

阅读量3.5k

点赞数

分类专栏：数据挖掘文章标签：分类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/troubleisafriend/article/details/48197631

版权

1 KNN算法

原理：已知样本集中每一个数据与所属分类的对应关系，输入没有标签的新数据后，将新数据与训练集的数据对应特征进行比较，找出“距离”最近的k（通常k<20）数据，选择这k个数据中出现最多的分类作为新数据的分类。
算法描述：
(1) 计算已知类别数据及中的点与当前点的距离；
(2) 按距离递增次序排序
(3) 选取与当前点距离最小的k个点
(4) 确定前K个点所在类别出现的频率
(5) 返回频率最高的类别作为当前类别的预测
距离计算方法有”euclidean”（欧氏距离）,“wski”（明科夫斯基距离）,”maximum”（切比雪夫距离）,”manhattan”（绝对值距离）,”canberra”（兰式距离）,”minkowski”（马氏距离）等。
优点：精度高、对异常值不敏感、无数据输入假定。
缺点：计算复杂度高，空间复杂度高。

2 决策树

生成决策树的步骤：
(1) 根据给定的训练数据，根据属性选择度量选择每一个维度来划分数据集，找到最关键的维度。
(2) 当某个分支下所有的数据都数据同一分类则终止划分并返回类标签，否则在此分支上重复实施(1)过程。
(3) 依次计算就将类标签构建成了一棵抉择树。
(4) 依靠训练数据构造了决策树之后，我们就可以将它用于实际数据的分类。
典型的算法有

最低0.47元/天解锁文章

troubleisafriend

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
各种分类算法比较

1 KNN算法原理：已知样本集中每一个数据与所属分类的对应关系，输入没有标签的新数据后，将新数据与训练集的数据对应特征进行比较，找出“距离”最近的k（通常k<20）数据，选择这k个数据中出现最多的分类作为新数据的分类。算法描述： (1) 计算已知类别数据及中的点与当前点的距离； (2) 按距离递增次序排序 (3) 选取与当前点距离最小的k个点 (4) 确定前K个点所在类别出现的频
复制链接

扫一扫

专栏目录

troubleisafriend CSDN认证博客专家 CSDN认证企业博客

码龄13年

75: 原创

18万+: 周排名

210万+: 总排名

33万+: 访问

: 等级

2680: 积分

102: 粉丝

75: 获赞

4: 评论

467: 收藏

私信

关注

热门文章

分类专栏

R语言基础 9篇
统计学 13篇
统计分析 3篇
数据挖掘 11篇
时间序列分析 2篇
sql 11篇
金融计算 10篇
ggplot2包 2篇
excel技巧 8篇
股票 2篇
其他 1篇

最新评论

第十三章时间序列分析和预测
2301_79328865: 您好，Gompertz曲线三和法在spss中可以操作吗？我想请教一下
“均线金叉和均线死叉”的经典战法
jinzl888: 将死不死看着明白，不知道怎么写。
“均线金叉和均线死叉”的经典战法
LUO々: 👍👍👍👍👍👍
第十三章时间序列分析和预测
leiann_china: 非常好。找了半天的资料。这篇解决了我的问题。分解、平滑之间的关系阐释出来了。谢谢。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。