数据挖掘
文章平均质量分 70
Black_lafier
一个代码爱好者,总做着代码改变世界的春梦。汗-_-||啊
展开
-
数据挖掘简介
数据挖掘的简介内容来源于《Python数据挖掘入门与实践》数据挖掘旨在让计算机根据已有数据做出决策。决策可以是预测明天的天气、拦截垃圾邮件、检测网站的语言,或者在约会网站上发现新的恋爱对象。数据挖掘方面的应用已经有很多,新的应用也在源源不断地出现。数据挖掘涉及算法、统计学、工程学、最优化理论和计算机科学相关领域的知识。除此之外,我们还会用到语言学、神经科学、城市规划等其他领域的概念或知原创 2018-01-07 13:09:26 · 353 阅读 · 0 评论 -
数据挖掘支持度、错误率、置信度解析
对于数据挖掘中的规则,规则的优劣有多种衡量方法,常用的是支持度(support)和置信度(confidence)下面将介绍一下支持度和置信度。举个例子,商店里面有四种商品:苹果、香蕉、奶油、菠萝。假定有以下几条数据(1代表购买、0代表不购买) 苹果 香蕉 奶油 菠萝 1 0 1 0 1 1 0 0 1 0 0原创 2018-01-07 14:20:52 · 8760 阅读 · 1 评论 -
Python数据挖掘-OneR算法简介
OneR算法内容来源于《Python数据挖掘入门与实践》在末尾有源代码,但需要使用Jupyter notebook,大家可以去我的另一篇文章找安装教程。http://blog.csdn.net/xinan_zxy/article/details/78935571文中的涉及到的错误率概念,大家可以去我的另一篇文章了解。http://blog.csdn.net/xinan_zxy/原创 2018-01-07 18:00:42 · 1438 阅读 · 0 评论 -
数据挖掘Apriori算法简介
Apriori算法是一种用于关联规则挖掘(Association rule mining)的代表性算法,它同样位居十大数据挖掘算法之列。关联规则挖掘是数据挖掘中的一个非常重要的研究方向,也是一个由来已久的话题,它的主要任务就是设法发现事物之间的内在联系。关联规则在介绍Apriori算法之前,我们先分析一下关联规则。 关联规则即 X->Y 的蕴涵表达式。当 X 成立时,Y也会成立。而验原创 2018-01-20 19:44:32 · 1170 阅读 · 0 评论