Data Mining
yaoyepeng
学生
展开
-
Weka使用入门
1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。 WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器转载 2009-12-27 20:15:00 · 1023 阅读 · 0 评论 -
数据挖掘中易犯的10个错误
按照Elder博士的总结,这10大易犯错误包括:0. 缺乏数据(Lack Data)1. 太关注训练(Focus on Training)2. 只依赖一项技术(Rely on One Technique)3. 提错了问题(Ask the Wrong Question)4. 只靠数据来说话(Listen (only) to the Data)5. 使用了未转载 2010-01-09 16:06:00 · 2256 阅读 · 0 评论 -
聚类分析中几种算法的比较
<br /> 将数据库中的对象进行聚类是聚类分析的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大,为了找到效率高、通用性强的聚类方法人们从不同角度提出了近百种聚类方法,典型的有K-means方法、K-medoids方法、CLARANS方法,BIRCH方法等,这些算法适用于特定的问题及用户。本文综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中常用聚类方法作了比较分析,以便于人们更容易、更快捷地找到一种适用于特定问题及用户的聚类算法。转载 2011-03-27 19:40:00 · 39439 阅读 · 0 评论 -
UCI数据集和源代码&数据挖掘的数据集资源
<br />《UCI数据集和源代码》<br />UCI数据集是一个常用的标准测试数据集,下载地址在<br />http://www.ics.uci.edu/~mlearn/MLRepository.html<br />我的主页上也有整理好的一些UCI数据集(arff格式):<br />http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip<br />在看别人的论文时,别人使用的数据集会给出数据集的出处或下载地址(除非是很机密的数据,例如与国家安全有关)转载 2011-03-27 21:15:00 · 9565 阅读 · 0 评论 -
数据挖掘领域顶级会议期刊及其分析
JournalsACM TKDD http://tkdd.cs.uiuc.edu/DMKD http://www.springerlink.com/content/1573-756X/?p=859c3e83455d41679ef1be783e923d1d&pi=0IEEE TKDE http://www.ieee.org/organizations/pubs/transactions/tkd转载 2011-06-09 12:55:00 · 28756 阅读 · 3 评论