使用Orange进行数据挖掘之分类(2)------KNN分类

最新推荐文章于 2023-10-28 08:00:00 发布

yiweis

最新推荐文章于 2023-10-28 08:00:00 发布

阅读量4.8k

点赞数

分类专栏：数据挖掘 Orange 云计算 Python 文章标签： Orange python Python 数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aaron315/article/details/8459241

版权

Python 同时被 3 个专栏收录

13 篇文章 0 订阅

订阅专栏

8 篇文章 1 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

knn基本概念

knn把每个样例看做是空间上的一个点，给定一个测试样例，

使用适当的邻近性度量算法，计算出该点与训练集中其他点的邻近度。选择K个最相近的点。

在选择出的K个样例中，比例最好的类就是测试样例的类。

从以上描述中可以看出，如果k选择的太小，该算法容易受到噪声的影响，而产生过度拟合的影响，然而如果选择的过大，可能造成误分类。

算法描述：

k是最近邻数目，D是训练样例的集合，z是测试样例
for 样例 in 训练样例集合：
     z和每个样例的相似度
找到k个最相近的样例集合
k个样例中类标号最多的类，就是测试样例的类标号。

Orange中的knn

以iris数据为例：

import Orange
#加载数据
iris = Orange.data.Table('iris')
knn = Orange.classification.knn.kNNLearner(iris, k=10)

for i in iris:
     #将预测结果和实际结果不同的部分输出
     if i.getclass()!=knn(i):
         print i.getclass(),knn(i)





输出结果如下：


Iris-versicolor Iris-virginica
Iris-versicolor Iris-virginica
Iris-virginica Iris-versicolor
Iris-virginica Iris-versicolor
Iris-virginica Iris-versicolor


该数据集共有150个实例，从结果看有5个预测结果是错误的。

下面以图形化的方式来比较朴素贝叶斯分类、KNN分类、s。
下图展现了用orange图形界面的方法：



下图给出了这一比较结果:

从上面的结果中可以看出knn和其他几个方法基本相当。


参考资料


 数据挖掘导论 http://book.douban.com/subject/5377669/

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

yiweis CSDN认证博客专家 CSDN认证企业博客

码龄17年

20: 原创

31万+: 周排名

39万+: 总排名

10万+: 访问

: 等级

1215: 积分

22: 粉丝

2: 获赞

6: 评论

22: 收藏

私信

关注

热门文章

分类专栏

Flex 1篇
Robotlegs 1篇
网络
cloudfoundry 1篇
bosh
云计算 6篇
数据挖掘 6篇
Orange 8篇
Python 13篇
机器学习 1篇

最新评论

virtualenv、pip备忘
大号小白兔: 感谢分享
Cloud Foundry参赛博文——用BOSH部署CloudFoundry实战
u011650252: memcached-1.4.13.tar.gz pcre-8.12.tar.gz apache-couchdb-1.2.0.tar.gz mongodb-linux-x86_64-1.8.5.tgz Python-2.6.5.tar.bz2 apache-maven-3.0.4.tar.gz nginx-0.8.54.tar.gz Python-2.6.5.tgz apache-tomcat-7.0.27.tar.gz nginx-lua.v0.3.1rc24.tar.gz rabbitmq-server-generic-unix-2.4.1.tar.gz devel-kit-v0.2.17rc2.tar.gz nginx_upload_module-2.2.0.tar.gz rabbitmq-server-with-plugins-generic-unix-2.4.1.tar.gz elasticsearch-0.19.4.tar.gz node-v0.4.0.tar.gz redis-2.2.15.tar.gz elasticsearch-http-basic-1.0.3.jar node-v0.4.12.tar.gz ruby-1.8.7-p357.tar.bz2 headers-more-v0.15rc1.tar.gz node-v0.6.8.tar.gz ruby-1.9.2-p180.tar.gz libevent-2.0.19-stable.tar.gz node-v0.8.2.tar.gz ..... 可以的话发我邮箱吧，先谢谢了 39077057@qq.com
OpenERP 7.0版本发布
ListCNzhang: xmroger所发信息不实，请删除！
OpenERP 7.0版本发布
xmroger: OpenERP进入中国大学课堂日前，上海对外贸易学院的张教授确认，该学院决定选择世界排名第一的开源ERP软件OpenERP作为ERP课程教学软件。他们之前用SAP软件。SAP只给学院开放了系统操作权限，系统配置、系统开发等权限都没有。SAP封闭式做法和学院所认为的，未来的商务应该越来越Open的理念不相符。大学是一个Public机构，课堂上讲解私有公司的ERP软件非常不合适。该学院张教授说：SAP只想利用中国的大学资源为他们培养“司机”，而大学更想培养的是维修师和设计师。因而，学院教研室研究之后，决定弃SAP而改用开源OpenERP！ OpenERP在中国的Partner OSCG公司和上海对外贸易学院合作，OSCG提供客户案例和教学数据，上海对外贸易学院制作基于OpenERP的大学教材和相关课件。成功之后，将免费向中国的所有大学推广该课程。另外据悉，河南理工大学能源学院“生产计划与控制”课程之前已经选用OpenERP作为教学软件，相关课程资料参见： http://sese.hpu.edu.cn/forum/read.php?tid=6&fid=9 。
Cloud Foundry参赛博文——用BOSH部署CloudFoundry实战
zhanhua9998: 说一下，我没用域控

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。