数据挖掘
zlging309
这个作者很懒,什么都没留下…
展开
-
数据流处理
来源:http://www.csdn123.com/html/blogs/20130617/23090.htm大数据流 即 实时收集的大量的数据。数据的流量大到无法实时将全部数据放入分析工具中处理。这里写写要解决的问题,及问题解决的思路,若是真的去实现,则需要考虑更多的问题、因素,需要查询更更详尽的资料。常见的数据流问题:转载 2013-08-08 09:11:11 · 1089 阅读 · 0 评论 -
Mapreduce不能做的
原文:http://www.analyticbridge.com/profiles/blogs/what-mapreduce-can-t-doWe discuss here a large class of big data problems where MapReduce can't be used - not in a straightforward way a原创 2013-08-23 15:44:21 · 734 阅读 · 0 评论 -
快速聚类算法
原文:http://www.bigdatanews.com/profiles/blogs/fast-clustering-algorithms-for-massive-datasetsHere we discuss two potential algorithms that can perform clustering extremely fast, on big data set转载 2013-08-23 15:45:55 · 1081 阅读 · 0 评论 -
比价技术总结
购物党网站有技术博客,有一些说明惠惠网是网易的比价网站,收集了大量的重要购物网站的信息原创 2013-08-25 17:19:33 · 813 阅读 · 0 评论 -
word2vec学习
谷歌已经使用Deep Learning技术开发了许多新方法来解析语言,目前,谷歌开源了一款基于Deep Learning的学习工具——word2vec,这是首款面向大众的Deep Learning学习工具学习中原创 2013-08-25 23:28:20 · 1281 阅读 · 0 评论 -
文档摘要技术
中文单文档摘要技术,区别于中文多文档摘要技术。那什么又是中文单文档摘要呢?就是对单篇文章自动抽取出内容摘要。更多内容,请查询相关文档。闲言少叙,直奔主题,我是宋鹏举。一、基于特征的方法可以考虑如下特征来进行文档摘要的生成,包括:文章标题(比如文章标题中出现的词具有较高的权重)、段落的位置(比如文章的首段和尾段具有较高的权重)、段落的特定句子(比如段落的首句和第二句具有较高的权重)、转载 2014-01-16 16:09:18 · 1093 阅读 · 0 评论 -
推荐系统
如何有效利用数据进行内容推荐?原创 2013-07-17 15:43:28 · 402 阅读 · 0 评论