数据挖掘
学习是持久的
这个作者很懒,什么都没留下…
展开
-
数据可视化工具
1、谷歌为数据分析和数据挖掘提供了一个开放的作图工具Google Chart,试用地址:https://developers.google.com/chart/2、Tableau Software公司的免费软件 http://www.tableausoftware.com/public/gallery/geography-diabetes3、visual4、R语言作图原创 2016-04-15 09:07:09 · 644 阅读 · 1 评论 -
数据挖掘--Apriori
Apriori:关联规则Apriori 核心算法过程如下:过单趟扫描数据库D计算出各个1项集的支持度,得 到频繁1项集的集合。连接步:为了生成,预先生成,由2个只有一个项不同的属于的频集做一 个(k-2)JOIN运算得到的。剪枝步:由于是的超集,所以可能有些元素不是频繁的。在 潜在k项集的某个子集不是中的成员是,则该潜在频繁项集不可能是频繁的可以从中移去。通过 单趟扫描数据库D原创 2016-04-19 21:39:38 · 455 阅读 · 0 评论 -
数据挖掘十大经典算法
1、C4.52、k-Means3、SVM4、Apriori5、EM6、PageRank7、AdaBoost8、kNN9、Naive Bayes10、CART原创 2016-04-15 15:57:21 · 984 阅读 · 0 评论 -
数据挖掘基本知识框架
数据挖掘技术:关联分析;序列模式;分类;聚集;异常检测。构成数据挖掘算法的三要素:1、模式记述语言(反映了算法可以发现什么样的知识)2、模式评价(反映了什么样的模式可以称为知识)3、模式探索(包括针对某一特定模式对参数空间的探索和对模式空间的探索)数据挖掘的主要方法:分类;聚类;相关规则;回归;其他数据挖掘算法--分类与预测 分类(判定归纳树算法,贝叶斯分类,后向传播原创 2016-04-14 21:19:06 · 1997 阅读 · 0 评论 -
分类与回归
简要说明:不同的算法做成的分类器在不同的数据集上也会有不同的表现1、K最近邻算法算法核心思想:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特征2、决策树if-tnen3、神经网络算法思想:神经网络是通过对人脑的基本单元--神经元的建模和联接,探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和原创 2016-04-15 08:56:57 · 873 阅读 · 0 评论 -
逻辑回归内容整理
逻辑回归原创 2016-10-27 16:29:53 · 417 阅读 · 0 评论