自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 HDFS的灵魂33问

1 HDFS是什么HDFS 是 Hadoop Distribute File System 的简称Hadoop 分布式文件系统,是 Hadoop 核心组件之一,作为最底层的分布式存储服务而存在。2 分布式文件系统解决了什么问题大数据存储的问题它们是横跨在多台计算机上的存储系统能够为存储和处理超大规模数据提供所需的扩展能力。3 HDFS的组成与特性HDFS集群...

2019-08-27 20:00:22 154

原创 hadoop的灵魂19问

1 hadoop是什么?​ 适合大数据的分布式存储和计算平台,其中HDFS负责将海量数据进行分布式存储,mapreduce负责提供对数据的计算结果的汇总2 hadoop的四大特性(优点)是什么?扩容能力(Scalable):集群不够时,能够很方便的进行扩展成本低(Economical):可以用很多个普通廉价的机器组成服务器集群高效率(Efficient):通过并发数据,能在节点间动...

2019-08-17 11:09:28 155

原创 zookeeper的灵魂37问

1 大数据的4V特征是什么?1 数据量大(volume);2 数据增长高速(velocity);3 多样性(种类多(variety),有结构化,非结构化,半结构化);4 价值密度低(value)2 什么是集群?一组计算机,它们作为一个整体向用户提供一组网络资源,这些单个的计算机系统就是集群的节点(node)。3 集群有什么特性?可扩展性高可用性负载均衡错误恢复4 分布...

2019-08-15 11:48:50 314

原创 Spark基本解析

=========================Spark1=Q : 为什么使用Spark?A : Spark 是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台. Spark 成功构建起了一体化、多元化的大数据处理体系。在任何规模的数据计算中, Spark 在性能和扩展性上都更具优势。2=Q : Spark为什么会如此流行?A : 因为它有着优秀的数据模型和计算抽象, 以...

2019-08-06 10:26:31 118

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除