![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 62
gdufs_iiip
这个作者很懒,什么都没留下…
展开
-
lucene + IKAnalyzer 中文分词及索引,简单实例
import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.document.DateTools; import org.apache.lucene.index.IndexWriter; impo转载 2009-08-26 18:43:00 · 1751 阅读 · 0 评论 -
未来五年BI商业智能的走向
BI(商业智能)是当今企业软件市场上最令人兴奋的领域之一,这个行业正在发生变化,用户的需要和BI生态系统都在经历同步增长。Web 2.0使互联网正在经历根本性的变化。Web2.0一般被认为是面向消费者的,但其真正的影响却是在企业方面。通过向Web 2.0学习,BI将在未来五年经历一次根本性的转变,在这次转变中包括五项主要的革命。>用户革命面向消费者的技术已经变得更加易于使用。而商业系统却还转载 2009-08-26 20:05:00 · 329 阅读 · 0 评论 -
新一代商业智能
在适当的时候将适当的信息交给适当的人:从一开始,这句话就成为商业智能(BI)的最高境界。但是如今,关于 BI 和数据仓库(DW)社区如何实现那个目标的各种因素正在变化。当数据的来源、类型和绝对数量不断增长的时候,什么才是适当的信息?谁应该拥有这种信息——谁不应该拥有这种信息?当业务流程涉及需要跨越全球协作的多个用户和系统时,什么才是“适当的时候”? 答案是不确定的,也就是说,企业满足 BI转载 2009-08-26 20:14:00 · 520 阅读 · 0 评论 -
使用LUCENE快速实现属于自己的英文分词程序——附简单实现
简单的英文分词程序现在已经有很多现成的JAR包实现了此功能,最流行的就是LUCENE里的analysis包,analysis包里包含许多类型的分词器、过滤器、分析器,可以让我们自由组合实现我们需要的功能。 使用LUCENE的analysis包,可以快速实现按照字符分割的英文分词,附带过滤停用词功能的分词器(有默认的停用词表,也可以自己指定,指定方式有多种:包括停用词表的文本文档;把停用词加原创 2010-02-26 14:46:00 · 1972 阅读 · 0 评论 -
一种高效的混合聚类算法
<br /> 聚类分析是数据挖掘中的重要任务,就是根据对象之间的相似度将对象划分为不同的组,使得同一组内的对象相似度最大化,而不同组内的对象相似度最小化的方法。聚类分析通常用于从大量数据中寻找隐含的数据分布和模式,既可以作为一个独立的工具来使用,也可以作为其它算法(如特征构造与分类等)的预处理步骤。聚类分析已得到广泛地研究,在文献中已有许多聚类算法,然而对于大规模数据集的高效聚类算法的研究仍然是一个充满挑战的问题。<br /> Chameleon算法是一种基于图的层次聚类算法,该算法利用基于原创 2011-04-15 08:50:00 · 1272 阅读 · 1 评论 -
一种高效的搜索结果多层聚类方法
以Google和百度为代表的搜索引擎,在用户输入关键词进行查询后,返回的是成千上万的相关结果,往往需要用户花大量时间浏览与选择,不能满足用户快速获取信息的愿望。为了解决这一问题,很多学者开始研究检索结果聚类算法。当前检索结果聚类方法主要可以分为两类:基于文档的方法和基于标签的方法。基于文档的方法通常是先使用余弦夹角公式计算文本相似度,再采用传统的文本聚类算法对检索结果进行聚类,最后使用一种加权策略提取具有代表性的词或句子作为类别标签。 提出一种基于名词短语的检索结果多层聚类方法(multi-l原创 2011-04-15 08:41:00 · 982 阅读 · 1 评论 -
推荐网易公开课
自我感觉网易公开课真的做得很不错,课程同样是来自世界各大名校,最吸引人的是它提供中英文字幕,上面有各种学科的公开课,比如说数据挖掘方面的,上面有机器学习的课。其他的热门课程,比如“幸福课”,“死亡课”等等,不是我想为网易做广告,它实在做得很有特色,有时间就上去逛逛。(网易公开课网原创 2011-07-12 23:07:17 · 1610 阅读 · 2 评论 -
Mining social networks to predict your app choices
UNSURE which app to download to your smartphone? While you waver, internet giants like Apple and Google could soon be predicting what you wi转载 2011-08-11 16:21:00 · 489 阅读 · 0 评论 -
DARPA Seeks To Learn From Social For Warfare
Agency aims to explore how the use of social media--particularly on mobile devices--can be used to help wage military campaigns.By Eli转载 2011-08-12 19:12:32 · 1298 阅读 · 0 评论