当挖掘遇上分布式

“当数据遇上挖掘”是一个曾经被津津乐道的话题,反映了数据挖掘的重要性然而,当挖掘遇上海量的数据,当挖掘被要求提供实时或及时的计算结果,当挖掘遇上高维度应用时,很多的数据挖掘专家就没有那么自信和乐观了。

数据挖掘现今在越来越多的行业被应用,搜索领域也不例外。在这个领域,两种数据很流行:

  1. 搜索日志。这个数据可以让我们知道用户的行为;
  2. Web数据。主要是文本和链接等。

这两种数据,前者比较规范些。但是,他们的共同特性是:数据量很大。而现在的应用又希望我们能够尽快地提供分析结果,所以对传统的实现提出了高挑战。显然,一台机器是不能满足需要了,无论是内存还是CPU。所以,现今各大搜索公司里都不约而同地在挖掘上下足功夫,因为这个本事讲直接影响着体验。

分布式数据挖掘应运而生!作为一个搜索公司,我们也不例外。

手机搜索:wap.roboo.com

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值