大数据
文章平均质量分 95
小坏蛋儿&
一名大四学生,热爱学习…
展开
-
数据安全RAID技术
1988 年美国加州大学伯克利分校的 D. A. Patterson 教授等首次在论文 “A Case of Redundant Array of Inexpensive Disks” 中提出了 RAID 概念 ,即廉价冗余磁盘阵列( Redundant Array of Inexpensive Disks )。由于当时大容量磁盘比较昂贵, RAID 的基本思想是将多个容量较小、相对廉价的磁盘进行有机组合,从而以较低的成本获得与昂贵大容量磁盘相当的容量、性能、可靠性。原创 2023-04-16 14:38:28 · 525 阅读 · 1 评论 -
Hadoop集群的部署,安装和管理(头歌)
我们已经掌握了 Hadoop 单节点的安装与部署,那么分布式集群怎么搭建呢?接下来我们学习 Hadoop 分布式集群搭建。原创 2022-09-21 23:43:08 · 6667 阅读 · 6 评论 -
基于 RDD 的分布式数据处理实验(pyspark)
ubuntu环境下安装anaconda,jupyter notebook与spark连接并实现交互,并基于恐怖袭击数据集通过RDD实现数据分析及可视化;最后附上standalone和yarn的两种任务提交方式的方法。原创 2022-10-10 23:12:36 · 853 阅读 · 3 评论