熟悉大数据存储基础（实验报告）

晨序猿

已于 2022-09-08 11:31:05 修改

阅读量1.7k

点赞数 2

文章标签：大数据

于 2022-09-08 11:29:02 首次发布

本文链接：https://blog.csdn.net/m0_52846388/article/details/126761135

版权

【实验与思考】
实验目的
（1）熟悉大数据存储基础
（2）熟悉大数据技术的基本概念
（3）熟悉开源技术及其商业支援熟悉分布式系统，了解hadoop分布式处理技术
（4）熟悉大数据的数据处理基础知识，了解大数据存储的技术路线
2.工具/准备工作
开始本实验之前，请认真阅读课程的相关内容。
准备一台带有浏览器，能够访问因特网的计算机。
3.实验内容与步骤请查阅相关文献资料，为“大数据”给出一个权威性的定义。
答："大数据"是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产
这个定义来源于：Gartner Group第一家信息技术研究和分析的公司
4.请具体描述大数据的3V
答：①Volume（数量）：是大数据的首要特征，数据体量巨大。当今世界需要进行及时处理以提取有用信息的数据数量级已经从TB级别，跃升到PB甚至EB级别
②Variety（种类）：数据类型繁多。大数据的挑战不仅是数据量的大，也体现在数据类型的多样化。除了前文提到的网络日志、地理位置信息等具有固定结构的数据之外，还有视频、图片等非结构化数据
③Velocity（速度）：处理速度快。信息的价值在于及时，超过特定时限的信息就失去了使用的价值。请查阅相关文献资料，简述“促进大数据发展”的主要因素答：：数据可视化使数据解读到了一种更加通俗易懂的阶段，使数据的接收和理解变得更加快速和简单：数据集成治理后使得原来零散无用的数据变得有价值，利用互联网络技术还能进行实时统计

最低0.47元/天解锁文章