读Google的三篇重要论文有感

读Google的三篇重要论文有感

Google的三篇重要论文分别是Google FS、MapReduce、BigTable,这三篇论文奠定了风靡全球的大数据算法的基础。

GFS发表于2003年,GFS系统由单个Master和大量块服务器构成,Master存放文件系统的所有元数据,而客户端从Master获取目标数据块的位置信息后,直接和块服务器交互进行读取操作。是一个可以扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它虽运行于价格低廉的普通硬件上,但却可以提供容错功能。这使部件的错误不再被当作异常,而是将其作为常见的情况加以处理。这使它可以给大量的用户提供总体性能较高的服务。

Mapreduce发表于2004年,它的模型分map、reduce两部分。它以GFS为基础,利用分布式计算思想,把大量数据拆分给多个低性能电脑,处理后的结果汇总输出。所以我们只需要输入需要定义任务、去除错误的数据,静等结果即可。由于参与运算的计算机都是性能较低的计算机,有时master会罢工,这时候所有的worker就会投票选出一个新的master。为防止worker罢工,就设置了一个程序让worker每隔一定时间向master发送信号,如果master没有接收到信号,master就会将任务分配给其他的worker。这可以使低性能的电脑省去昂贵的成本,用多台电脑的处理方式增加了容错率,并行处理大大减少了处理时间。

Bigtable发布于2006年,它是建立在 GFS 和 MapReduce之上的,是一个分布式的结构化的存储系统,是一个大型的具有容错性和自治性的系统。它可以可靠的处理PB级的数据和能够部署到千万台机器上。目前Google的很多项目都使用Bigtable存储数据。

看了Google这三篇论文后让我感叹前人的智慧,作为一名大二非该专业的学生,要理解这三篇论文还需要大量时间的积累,通过这三篇论文我了解了大数据的思想,放宽了视野。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值