我对于大数据的认识

最新推荐文章于 2022-10-10 00:37:06 发布

sincere_love

最新推荐文章于 2022-10-10 00:37:06 发布

阅读量2w

点赞数 2

分类专栏：进步笔录文章标签：大数据 HDFS 备份机制 pipeline管道

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sincere_love/article/details/91400217

版权

本文探讨了大数据的基本概念，强调了其在现代社会的重要性。文章提到了解决大数据量问题的两种方法：垂直扩展和横向扩展，并重点介绍了谷歌的三大论文对大数据处理的贡献，特别是HDFS分布式文件系统。HDFS的主从架构、读写机制、副本备份策略以及pipeline管道在存储效率中的作用也被详细阐述。此外，还讨论了大数据备份的两种策略，以确保数据安全。

摘要由CSDN通过智能技术生成

今天来说一说对于大数据这个词的理解以及初步的认识；
（以下只是本人简短学习之后的总结，如有错误欢迎指出）

我对于大数据的认知是：短时间内快速产生的大量且多种多样的有价值的信息；
在以往，数据产生速度慢，节奏慢，而现在呢社会科技发展之快是肉眼可见的，当然也有很多是我们还没真正地感受到，就已经有开始了更先进的技术发布；对于这一数据量过大的问题，有两个解决方法：
1：垂直扩展：就好比你的电脑要扩大容量是在电脑本身上添加硬盘；
2：横向扩展：是多台服务器连在一起的扩展；（这其中只需要简单廉价的服务器或者PC端就可以了）

在此处将提到谷歌的三大论文：堪称大数据的鼻祖
GFS=================》由此研发出了HDFS分布式文件系统
MapReduce ==》分布式的处理
BigData》HBase

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时，它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。
Hadoop-------h

最低0.47元/天解锁文章

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。