N__xc-CSDN博客

原创 SparkRDD理解

谈谈你对spark core的理解：rdd (Resilient Distributed Dataset) 弹性分布式数据集，是spark的基石，是实现spark数据处理的核心抽象，代表一个不可变，可分区，里面的元素可并行计算的集合。rdd五大特点：分区：都是逻辑上的分区，是抽象的存在只读：要想改变RDD的数据，只能创建新的RDD 依赖：指RD...

2022-03-18 09:07:54 184

Redis中基本数据类型以及他们的内部实现方式字符串（String）：①int ，8个字节的长整型②embstr，小于等于44个字节的字符串③raw，大于等于44个字节的字符串哈希（hash）：哈希的编码有两种，分别是压缩列表和哈希表。当所有键值对的键和值的长度都小于（默认为64字节），并且键值对的数量小于（默认为512个）的时候，哈希就会使用压缩列表作为编码，否则使用哈希表作为编码。列表（list）：列表的内部编码有两种：压缩列表和链表。压缩列表是由一个连续内存组成的顺序

2022-03-16 16:20:13 74

原创每日面试题（2）

1.tcp与udp的区别①TCP面向连接，UDP是无连接的，即发送数据之前不需要连接②TCP提供可靠的服务，通过TCP连接传送的数据无差错，不丢失，不重复，且按序到达。UDP尽最大努力交付但不保证按需按时交付③TCP面向字节流，实际上是TCP把数据看成一串无结构的字节流。UDP是面向报文的④每一条TCP连接只能是点到点的。UDP支持一对一，一对多，多对一和多对多的交互通信⑤TCP首部开销20字节。UDP首部开销只需8字节⑥TCP的逻辑通信信道是双全工的可靠信道。UDP则是不可靠信道

2022-03-16 15:39:19 64

原创每日面试题（1）

1.Hadoop是什么hadoop是Apache基金会所开发的可靠、高效、可伸缩、可扩展的分布式计算开源框架，利用服务器集群，根据用户的自定义业务逻辑对海量数据进行分布式处理，核心组件包括：HDFS(分布式文件系统)，YARN(运算资源调度系统)，MAPREDUCE(分布式运算编程框架)。2. Java的特性1.封装(Encapsulation) ：定义：是指隐藏对象的属性和实现细节，仅对外提供公共访问方式。原则：将不需要对外提供的内容都隐藏起来，把属性都隐藏提供公共方法对其访问常

2022-03-11 17:58:52 554

原创 zookeeper集群搭建

首先先测试Hadoop集群时间，确保集群时间同步Hadoop集群机器策划192.168.137.2 hadoop01 nn1 dn zk qjm192.168.137.3 hadoop02 nn2 dn zk qjm192.168.137.4hadoop03 dn zk qjmJDK规划：1.7以上防火墙规划：系统防火墙关闭SSH免密码规划hadoop01可免密访问hadoop02，hadoop03hadoop02可免密访问hadoop0...

2021-12-15 11:02:56 2221

原创 hadoop集群搭建

一.需要三台主机(1台虚拟机，克隆两个)192.168.137.1 father MAC地址不同192.168.137.2 son01 MAC地址不同192.168.137.3 son02 MAC地址不同1.1 主机配置a>先查看父主机ip地址# ip addr# vi /etc/sysconfig/network-scripts/ifcfg-ens33b>重启网卡：#systemctl r...

2021-12-06 20:39:11 1604

N__xc的博客

原创 SparkRDD理解

转载每日面试题（3）

原创每日面试题（2）

原创每日面试题（1）

原创 zookeeper集群搭建

原创 hadoop集群搭建

空空如也

空空如也

原创 SparkRDD理解

转载 每日面试题（3）

原创 每日面试题（2）

原创 每日面试题（1）

原创 zookeeper集群搭建

原创 hadoop集群搭建

空空如也

空空如也

转载每日面试题（3）

原创每日面试题（2）

原创每日面试题（1）