自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Zookeeper

Zookeeper的选举机制可灵活回答:(1)Zookeeper的选举策略(2)Zookeeper的选举过程(3)Zookeeper的Leader选举是如何实现的1、半数机制:集群半数以上机器存活,集群可用。所以Zookeeper适合安装奇数台服务器。2、Zookeeper虽然在配置文件中并没有指定Master和Slave,但是,Zookeeper工作时,是有一个节点为Leader,其他则为Follow,Leader是通过内部的选举机制临时产生的。(3)选举过程假设有舞台服务器组成的Zook

2021-10-11 14:25:55 50

原创 Object类中方法

Object 类中方法及说明如下:registerNatives() //私有方法getClass() //返回此 Object 的运行类。hashCode() //用于获取对象的哈希值。equals(Object obj) //用于确认两个对象是否“相同”。clone() //创建并返回此对象的一个副本。toString() //返回该对象的字符串表示。notify() //唤醒在此对象监视器上等待的单个线程。notifyAll() //唤醒

2021-09-07 20:14:24 59

原创 HBase

HBase的rowkey设计原则(1)HBaser如何设计rowkey(2)你HBase的rowkey为什么这么设计?有什么优缺点?(3)HBase rowkey设置讲究HBase中,表会被划分为1…n个Region,被托管在RegionServer中。Region两个重要的属性,StarKey与EndKey表示这个Region维护的rowkey范围,当我们要读/写数据时,如果rowkey落在某个start-end key范围内,那么就会定位到目标region并且读/写到相关的数据。那怎么快速精准

2021-09-07 19:58:29 60

原创 Kafka

Kafka(1)kafka为什么低延迟高吞吐(2)kafka高吞吐的原因(3)kafka为什么高可用、高吞吐(4)kafka如何保证高吞吐量1、顺序读写kafka的消息是不断追加到文件中的,这个特性使kafka可以充分利用磁盘的顺序读写性能,顺序读写不需要硬盘磁头的寻道时间,只需要很少的扇区旋转时间,所以速度远快于随机读写。Kafka官方给出了测试数据(Raid-5,7200rpm)顺序 I/O:600MB/s随机 I/O:100KB/s(2)零拷贝先简单了解下文件系统的操作流程,例如

2021-09-07 19:40:44 43

原创 MapReduce工作原理

二、MapReduce工作原理(1)MapReduce执行流程(2)对MapReduce的理解(3)MapReduce过程(4)MapReduce的详细过程(5)MapTask和ReduceTask工作机制(6)MapReduce中有没有涉及到排序(1)准备一个200M的文件,submit中对原始数据进行切片;(2)客户端向Yarn提交信息,Yarn开启一个MrAppmaster,MrAppmaster读取客户端对应的信息,主要是job.split,然后根据切片个数(这里2个)开启对应数量

2021-09-07 15:20:50 514

原创 Flume

AgentAgent 是一个JVM进程,它以时间的形式将数据从源头送至目的地。SourceSource是负责接收数据到FLume Agent的组件。ChannelChannel是位于Source和Sink之间额缓冲区。因此,Channel允许Source和Sink运作在不同的速率上。Channel是线程安全的,可以同时处理几个Source的写入操作和几个Sink 的读取操作。SinkSink不断地轮询Channel中的事件且批量的移除它们,并将这些事件批量写入到存储或索引系统、或者被发送到

2021-09-07 15:20:00 28

原创 volatile与synchronized的区别

volatile的本质是高数jvm当前变量在寄存器中的值是不确定的,需要从主存中读取,synchronized则是锁定当前变量,只有当前线程可以访问该变量,其他线程被阻塞住。volatile仅能使用在变量级别,synchronized则可以使用在变量,方法。volatile仅能实现变量的修改可见性,但不具备原子特性,而synchronized则可以保证变量的修改可见性和原子性。volatile不会造成线程的阻塞,而synchronized可能会造成线程的阻塞。volatile标记的变量不会被编译器优

2021-08-31 14:40:19 53

原创 shell

1 shell概述大数据程序员为什么要学习shell呢?(1)需要看懂运维人员编写的shell程序(2)偶尔会编写一些简单的shell程序来管理集群,提高开发效率什么是shellshell是一个命令行解释器,它接收应用程序/用户命令,然后调用操作系统内核shell还是一个功能相当强大的编程语言,易编写、易调试、灵活性强2 Shell解析器(1)Linux提供的Shell解析器有:cat /etc/shells/bin/sh/bin/bash/sbin/nologin/bin/d

2021-07-18 17:43:04 73

原创 linux常用基本命令 虚拟机克隆 企业面试题

7 常用基本命令7.1 帮助命令7.1.1 man获得帮助信息基本语法man [命令或配置文件](功能描述:获得帮助信息)显示说明help获得shell内置命令的帮助信息基本语法help 命令 (功能描述:获得shell内置命令的帮助信息)7.1.3 常用快捷键7.2 文件目录类pwd:print working directory 打印工作目录pwd显示当前工作目录的绝对路径基本语法pwd (功能描述:显示当前工作目录的绝对路径)

2021-07-17 10:00:45 275

原创 虚拟机配置

5 网络配置和系统管理操作5.1 查看网络IP和网关查看虚拟网络编辑器修改虚拟网卡查看网关查看Windows环境中的VMnet8网络配置5.2 配置网络IP地址ifconfig:network interfaces configuring网络接口ifconfig :network interfaces configuring网络接口配置1.基本语法ifconfig (功能描述:显示所有网络接口的配置信息)案例实操(1)查看当前网络ipif

2021-07-07 20:59:08 374

原创 Linux概述

1 Linux入门1.1 概述1.1.1 为什么要学Linux?开源、稳定、漏洞少,靠谱公司都用它。1.1.2 什么是Linux?Linux,全称GNU/Linux,是一种免费使用和自由传播的类UNIX操作系统,其内核由林纳斯·本纳第克特·托瓦兹于1991年10月5日首次发布1.1.3 有什么特点?1、多用户、多任务、支持多线程和多CPU的操作系统。2、能运行主要的Unix工具软件、应用程序和网络协议。3、它支持32位和64位硬件。1.2 Linux和Windows区别1.3 Cent

2021-07-06 15:23:56 73

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除