数据挖掘
文章平均质量分 75
cyw1900
Data Mining, Recommender Systems,Internet Technologies,for sharing.
展开
-
WEKA使用教程(经典教程转载)
目录 1. 简介2. 数据格式3.数据准备4. 关联规则(购物篮分析)5. 分类与回归6. 聚类分析 1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,转载 2014-05-08 17:54:48 · 760 阅读 · 0 评论 -
UCI数据集和源代码
UCI数据集是一个常用的标准测试数据集,下载地址在http://www.ics.uci.edu/~mlearn/MLRepository.html我的主页上也有整理好的一些UCI数据集:http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip在看别人的论文时,别人使用的数据集会给出数据集的出处或下载地址(除非是很机密的数据,转载 2014-07-04 09:55:19 · 961 阅读 · 0 评论 -
IKAnalyzer中文分词(入门,持续更新中)
IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0原创 2014-08-17 09:24:37 · 1300 阅读 · 0 评论