- 博客(7)
- 资源 (3)
- 收藏
- 关注
转载 数据挖掘相关的10个问题
NO.1 Data Mining 和统计分析有什么不同? 硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Data Mining的出现会引
2011-12-26 13:06:19 2378
转载 用Flex Builder在一个Flex项目中编译多个Application(.mxml)
One day, i want to compile my business app with TestSuiteRunner (from FlexUnit) app at one time using Flex Builder, but i never do this before. Flex Builder can not set two application once. But, it c
2011-12-21 14:55:07 2736
转载 文本分类和聚类有什么区别
简单点说:分类是将一篇文章或文本自动识别出来,按照已经定义好的类别进行匹配,确定。聚类就是将一组的文章或文本信息进行相似性的比较,将比较相似的文章或文本信息归为同一组的技术。分类和聚类都是将相似对象归类的过程。区别是,分类是事先定义好类别,类别数不变。分类器需要由人工标注的分类训练语料训练得到,属于有指导学习范畴。聚类则没有事先预定的类别,类别数不确定。聚类不需要人工标注和预先训练分类器,类别在聚
2011-12-15 21:01:02 5940
原创 数据挖掘
从百科上找到的。方便自己看。潜在有用的、最终可理解的模式的非平凡过程。目录什么是数据挖掘数据挖掘的起源数据挖掘能做什么数据挖掘中的关联规则数据挖掘和在线分析处理(OLAP)数据挖掘,机器学习和统计软硬件发展对数据挖掘的影响数据挖掘相关的10个问题展开 数据挖掘什么是数据挖掘 数据挖掘,在人工智能领域,习惯上又称为数据库
2011-12-08 15:54:01 5624
转载 luke使用
转自:http://hi.baidu.com/thinke365/blog/item/3ea7b859453b738b800a18d1.html首次用Luke打开索引文件。Overview里面显示了索引具有的Field数目(以最大的Field为准吧?),还有就是文档的总数和 Term即索引词的总数? 有时一个关键词,对应于多个文档,所以文档数要多于关键字数目。还显示了索引的版本和索引的格式
2011-12-08 15:52:19 5677
原创 把任意字符转成浏览器能够识别的特殊符号
public static String toHtmlEntity(String c){ if(c!=null&&c.length()>0){ String temp=""; for(int i=0;i<c.length();i++){ temp=temp+"&#"+(int)c.charAt(i)+"
2011-12-08 15:50:11 1946
原创 常用的网址收集
sorl: http://ronxin999.blog.163.com/blog/static/4221792020117304579589/lucene: http://www.cnblogs.com/keith2011/archive/2011/09/12.htmlfirefox官网: https://addons.mozilla.org/en-US/firefox/addon/fi
2011-12-08 15:46:03 889
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人