数据挖掘
DHD_only
在一家业界认为最累的公司上班
展开
-
北京CBD
问题:什么是CBD?CBD是什么意思?CBD是英文全称Central Business District,CBD指一个国家或大城市里主要商业活动进行的地区。我国现有三种译法:中央商务区、商务中心区或中央商业区。 CBD概念最早产生于1923年的美国,当时定义为"商业会聚之处"。随后,CBD的内容不断发展丰富,成为一个城市、一个区域乃至一个国家的经济发展中枢。一般而言,CBD应该具备以下要素特征:...原创 2011-08-09 10:58:31 · 373 阅读 · 0 评论 -
序列模式挖掘
转载自http://www.wentrue.net/blog/?p=1016 序列模式挖掘 所谓序列模式,我的定义是:在一组有序的数据列组成的数据集中,经常出现的那些序列组合构成的模式。跟我们所熟知的关联规则挖掘不一样,序列模式挖掘的对象以及结果都是有序的,即数据集中的每个序列的条目在时间或空间上是有序排列的,输出的结果也是有序的。 举个简单的例子来说明,关联规则一...原创 2011-12-15 20:31:31 · 252 阅读 · 0 评论 -
Nutch1.2 添加IKAnalyzer中文分词(zhuan)
http://blog.csdn.net/jiutao_tang/article/details/6461884原创 2013-04-08 10:05:19 · 164 阅读 · 0 评论 -
lucene3.0_IndexWriter基础使用及注意事项(转载)
http://www.cnblogs.com/huangfox/archive/2010/10/15/1852371.html原创 2013-04-09 11:32:06 · 138 阅读 · 0 评论