- 博客(3)
- 收藏
- 关注
转载 大数据学什么(转)
地址:https://blog.csdn.net/hayaqi0504/article/details/79366345经常有初学者在博客和QQ问我,自己想往大数据方向发展,该学哪些技术,学习路线是什么样的,觉得大数据很火,就业很好,薪资很高。如果自己很迷茫,为了这些原因想往大数据方向发展,也可以,那么我就想问一下,你的专业是什么,对于计算机/软件,你的兴趣是什么?是计算机专业,对操作系统、硬...
2018-09-27 14:25:56 325
转载 布隆过滤器的原理(转)
地址:https://www.cnblogs.com/Jack47/p/bloom_filter_intro.html 布隆过滤器(Bloom Filter)是一种节省空间的概率数据结构,由Burton Howard Bloom在1970年提出,用来测试一个元素是否在一个集合里。有可能”误报“,但肯定不会”错报“:对布隆过滤器的一次查询要么返回“可能在集合中“,要么”肯定不在集合里“。...
2018-09-27 14:25:27 172
原创 MapReduce设计模式总结
概要模式 数值概要 目的:基于某个键将记录分组,并将每个分组做一系列的聚合值,从而得到较大数据集的高层次试图适用场景:要处理的数据是数值数据或者计数 数据可以按照某些特定的字段分组已知应用:单词计数 记录计数 最大值/最小值/计数 平均值/中位数/标准差 倒排索引概要 目的:产生一个数据集的索引以提供更快的搜索或数据丰富能力适用场景:通常用在需要快速搜索...
2018-09-25 17:02:28 1772
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人