自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 SparkRDD理解

谈谈你对spark core的理解: rdd (Resilient Distributed Dataset) 弹性分布式数据集,是spark的基石,是实现spark数据处理的核心抽象,代表一个不可变,可分区,里面的元素可并行计算的集合。 rdd五大特点: 分区:都是逻辑上的分区,是抽象的存在 只读:要想改变RDD的数据,只能创建新的RDD 依赖:指RD...

2022-03-18 09:07:54 170

转载 每日面试题(3)

Redis中基本数据类型以及他们的内部实现方式 字符串(String): ①int ,8个字节的长整型 ②embstr,小于等于44个字节的字符串 ③raw,大于等于44个字节的字符串 哈希(hash): 哈希的编码有两种,分别是压缩列表和哈希表。当所有键值对的键和值的长度都小于(默认为64字节),并且键值对的数量小于(默认为512个)的时候,哈希就会使用压缩列表作为编码,否则使用哈希表作为编码。 列表(list): 列表的内部编码有两种: 压缩列表和链表。压缩列表是由一个连续内存组成的顺序

2022-03-16 16:20:13 68

原创 每日面试题(2)

1.tcp与udp的区别 ①TCP面向连接,UDP是无连接的,即发送数据之前不需要连接 ②TCP提供可靠的服务,通过TCP连接传送的数据无差错,不丢失,不重复,且按序到达。UDP尽最大努力交付但不保证按需按时交付 ③TCP面向字节流,实际上是TCP把数据看成一串无结构的字节流。UDP是面向报文的 ④每一条TCP连接只能是点到点的。UDP支持一对一,一对多,多对一和多对多的交互通信 ⑤TCP首部开销20字节。UDP首部开销只需8字节 ⑥TCP的逻辑通信信道是双全工的可靠信道。UDP则是不可靠信道

2022-03-16 15:39:19 56

原创 每日面试题(1)

1.Hadoop是什么 hadoop是Apache基金会所开发的可靠、高效、可伸缩、可扩展的分布式计算开源框架,利用服务器集群,根据用户的自定义业务逻辑对海量数据进行分布式处理,核心组件包括:HDFS(分布式文件系统),YARN(运算资源调度系统),MAPREDUCE(分布式运算编程框架)。 2. Java的特性 1.封装(Encapsulation) : 定义:是指隐藏对象的属性和实现细节,仅对外提供公共访问方式。 原则:将不需要对外提供的内容都隐藏起来, 把属性都隐藏提供公共方法对其访问 常

2022-03-11 17:58:52 545

原创 zookeeper集群搭建

首先 先测试Hadoop集群时间,确保集群时间同步 Hadoop集群机器策划 192.168.137.2 hadoop01 nn1 dn zk qjm 192.168.137.3 hadoop02 nn2 dn zk qjm 192.168.137.4hadoop03 dn zk qjm JDK规划 :1.7以上 防火墙规划:系统防火墙关闭 SSH免密码规划 hadoop01可免密访问hadoop02,hadoop03 hadoop02可免密访问hadoop0...

2021-12-15 11:02:56 2213

原创 hadoop集群搭建

一.需要三台主机(1台虚拟机,克隆两个) 192.168.137.1 father MAC地址不同 192.168.137.2 son01 MAC地址不同 192.168.137.3 son02 MAC地址不同 1.1 主机配置 a>先查看父主机ip地址 # ip addr # vi /etc/sysconfig/network-scripts/ifcfg-ens33 b>重启网卡: #systemctl r...

2021-12-06 20:39:11 1589

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除