- 博客(2)
- 收藏
- 关注
原创 分布式计算框架MapReduce
MapReduce原理 MapReduce是一种并行编程模型,用于大规模数据集的并行运算。“Map”(映射)和“Reduce”(归约)是它的主要思想。当前的软件实现是指定一个Map(映射)函数,实现任务的分配,指定并发的Reduce(归约)函数,用来任务的汇总。MapReduce概述1.MapReduce最早是由谷歌公司研究提出的一种面向大规模数据处理的并行计算模型和方法。2.2004年,Doug Cutting 基于Java设计
2020-11-02 14:25:31
960
1
原创 大数据专业认知实习
大数据专业认知实习自我介绍 我是19级大数据专业的一名学生。 现在是大数据时代,大数据顾名思义就是有很多的数据组成,因为现在这些数据有很多有用的数据,也有无用的数据,所以需要一些专业的大数据人员来维护这些信息,大数据的特点是大体量、处理速度快、价值密度低、多样。大数据显示体现最初是人口普查,按照老方法去普查人口需要很长的时间,这显然跟不上时代的步伐,所以人们开始从记录,采集,整理,分析等多给领域寻求加快数据分析的速度,大数据的概念也慢慢被提起。大数据的创意场景 如今,大数据体现最多的可能是社
2020-07-18 15:22:52
2615
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人