数据挖掘
蓝天的IT生涯
这个作者很懒,什么都没留下…
展开
-
WEKA学习总结
1. Weka处理的数据表格中,一个横行称为一个实例(Instance),竖行代表一个属性(Arrtibute),数据表格称为一个数据集,在weka看来,呈现了属性之间的一种关系(Relation) 2. Weka存储数据的格式是ARFF(Attribute-RelationFile Format)文件,这是一种ASCII文本文件。 3. Weka的ARFF文件可原创 2013-05-02 14:35:55 · 4872 阅读 · 0 评论 -
Apriori算法
Apriori算法是我的第一个数据挖掘算法,算处女作吧,哈哈哈。在这之前我对数据挖掘算法恐惧,觉得太难了,只是大致看了下原理,然后在clementine上拖几个控件跑下demo,运行的结果很好但是总觉得技术含量不高,我不知道为什么要这么做,为什么那些参数要那么设置,更糟糕的是发现那些算法过一段时间都忘记了。没办法,不入虎穴焉得虎子,我逼迫自己根据书上提供的讲解和伪码,琢磨着用什么数据结构保存数据?转载 2014-08-01 09:31:12 · 2352 阅读 · 1 评论 -
《数据挖掘概念与技术》学习笔记
1.Chapter1 引论: (1) OLTP 和 OLAP 概念: OLTP(on-line transaction processing) 联机事物处理,就是我们经常说的关系数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。例如:mysql OLAP(on-line analytical processing) 联机分析处理,是数据仓库系统的主要应用,支持复杂的分析操作,侧重原创 2014-10-03 16:24:03 · 3543 阅读 · 0 评论