我对于大数据的认识

本文探讨了大数据的基本概念,强调了其在现代社会的重要性。文章提到了解决大数据量问题的两种方法:垂直扩展和横向扩展,并重点介绍了谷歌的三大论文对大数据处理的贡献,特别是HDFS分布式文件系统。HDFS的主从架构、读写机制、副本备份策略以及pipeline管道在存储效率中的作用也被详细阐述。此外,还讨论了大数据备份的两种策略,以确保数据安全。
摘要由CSDN通过智能技术生成

今天来说一说对于大数据这个词的理解 以及初步的认识;
(以下只是本人简短学习之后的总结,如有错误欢迎指出)

我对于大数据的认知是:短时间内快速产生的大量且多种多样的有价值的信息;
在以往,数据产生速度慢,节奏慢,而现在呢社会科技发展之快是肉眼可见的,当然也有很多是我们还没真正地感受到,就已经有开始了更先进的技术发布;对于这一数据量过大的问题,有两个解决方法:
1:垂直扩展:就好比你的电脑要扩大容量是在电脑本身上添加硬盘;
2:横向扩展:是多台服务器连在一起的扩展;(这其中只需要简单廉价的服务器或者PC端就可以了)

在此处将提到谷歌的三大论文:堪称大数据的鼻祖
GFS=================》由此研发出了HDFS分布式文件系统
MapReduce ==》分布式的处理
BigData
》HBase

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。
Hadoop-------h

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值