![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 79
sissi_shen
这个作者很懒,什么都没留下…
展开
-
《大数据互联网大规模数据挖掘与分布式处理》阅读笔记一
作者:沈慧 在看书之前,先查了查到底啥是大数据,精炼《大数据的四大误区》中的观点,然后自己理解一下如下:1. 大数据的数据量庞大是必要非充分条件,不仅要数据量有保证,更重要的是充分利用数据产生价值,分析数据才是核心!2. 懂大数据是指能力,而非技能。不是很理解作者所讲的的能力的定义,私以为,在海量数据时代的数据压力和业务需求下,只有掌握了大数据分析原创 2013-05-27 15:57:11 · 1877 阅读 · 0 评论 -
【原创】《大数据互联网大规模数据挖掘与分布式处理》阅读笔记(二)
【原创】《大数据互联网大规模数据挖掘与分布式处理》第二章大规模文件系统及MAP-Reduce 首先来看看这一章讲解的整体架构,分别介绍了分布式文件系统、Map-Reduce、使用Map-Reduce的算法,Map-Reduce扩展和集群计算算法的效率问题。原创 2013-06-07 20:08:18 · 3012 阅读 · 1 评论 -
【原创】《大数据互联网大规模数据挖掘与分布式处理》阅读笔记(三)
《大数据互联网大规模数据挖掘与分布式处理》阅读笔记(三) --------数据流挖掘原创 2013-06-18 13:15:33 · 4116 阅读 · 0 评论 -
《大数据互联网大规模数据挖掘与分布式处理》阅读笔记(四)-----WEB广告
作者: 沈慧 目前,许多WEB应用通过广告而维持生计,从在线广告中获益最多的是搜索应用,“adwords”模型就是一种用于搜索查询和广告匹配的模型。这一章介绍了在线广告的相关问题、在线算法、Adwords实现和问题等,具体框架如下图1所示。图1 Web广告主要框架图一、在线广告相关问题1、当前WEB广告机会:网站上的展示广告、在线上商店自主选择的广告、搜索广告。原创 2013-06-21 20:44:36 · 2168 阅读 · 2 评论