要想把大数据读懂，基于Hadoop与Spark的大数据开发实战pdf，足矣

最新推荐文章于 2024-01-13 13:49:24 发布

大数据基础入门教程

最新推荐文章于 2024-01-13 13:49:24 发布

阅读量1k

点赞数

文章标签：大数据 spark hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mnbvxiaoxin/article/details/104341570

版权

本文探讨大数据的基本概念，包括大数据的四大特征：数据量大、类型繁多、价值密度低和处理速度快。同时阐述了大数据带来的挑战，如对现有数据库的冲击、实时性技术的需求和数据中心运维的压力。最后，推荐了基于Hadoop与Spark的大数据开发实战资源。

摘要由CSDN通过智能技术生成

大数据基本概念

1.大数据概述

相信大家经常会在各种场合听到“大数据"这个词，被誉为数据仓库之父的BillInmon早在20世纪90年代就将大数据挂在嘴边了。那么到底什么是大数据呢?这是我们在本章要了解的。

我们现在生活的时代是一一个数据时代，近年来随着互联网的高速发展，每分每秒都在产生数据，那么产生的这些数据如何进行存储和相应的分析处理呢?各大公司纷纷研发和采用一批新技术来应对8益庞大的数据处理需求，主要包括分布式文件系统、分布式计算框架等，这些都是我们需要学习和掌握的。

《互联网周刊》对大数据的定义为:“大数据 ”的概念远不止大量的数据(TB)和处理大量数据的技术，或者所谓的“4个V"之类的简单概念，而是涵盖了人们在大规模数据的基础上可以做的事情，这些事情在小规模数据的基础上是无法实现的。换句话说，大数据让我们以一种前所未有的方式，通过对海量数据进行分析，来获得有巨大价值的产品和服务，或深刻的洞见，最终形成变革之力。

2.大数据特征

(1)数据量大(Volume)

随着网络技术的发展和普及。每时每刻都会产生大量的数据。在我们的日常生活中，比如说在电商网站购物、在直播平台看直播、在线阅读新闻等，都会产生很多的日志，汇在一起每分每秒产生的数据量将是非常巨大的。

(2)类型繁多(Variety)

大数据中最常见的类型是日志，除了日志之外常见的还有音频、视频、图片等。由于不同类型的数据没有明显的模式，呈现出多样性的特点，这对于数据的处理要求也会更高。

(3)价值密度低(Value)

现阶段每时每刻产生的数据量已经很大了,如何从大量的日志中提取出我们需要的、对我们有价值的信息才是最重要的。数据量越来越大，里面必然会存在着大量与我们所需不相干的信息，如何更迅速地完成数据的价值

最低0.47元/天解锁文章

大数据基础入门教程

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。