huzhan7-CSDN博客

原创 Flume总结

Flume总结 --huzhan1、你是如何实现Flume数据传输的监控的使用第三方框架 Ganglia 实时监控 Flume。2 、Flume的 Source，Sink，Channel的作用？你们 Source是什么类型？1、作用（1）Source 组件是专门用来收集数据的，可以处理各种类型、各种格式的日志数据，包括 avro、thrift、exec、jms、spooling directory、netcat、sequence g

2021-07-16 00:57:47 912

原创 Hbase总结

Hbase总结 --huzhan一、Hbase的六大特点：（1）、表大：一个表可以有数亿行，上百万列。（2）、无模式：每行都有一个可排序的主键和任意多的列，列可以根据需要动态增加，同一个表中的不同行的可以有截然不同的列。（3）、面向列：HBase是面向列的的存储和权限控制，列族独立索引。（4）、稀疏：空（null）列并不占用空间，表可以设计的

2021-06-30 14:19:26 1482

转载 HashMap总结

1：HashMap 的数据结构？A：哈希表结构（链表散列：数组+链表）实现，结合数组和链表的优点。当链表长度超过 8 时，链表转换为红黑树。transient Node<K,V>[] table;2：HashMap 的工作原理？HashMap 底层是 hash 数组和单向链表实现，数组中的每个元素都是链表，由 Node 内部类（实现 Map.Entry接口）实现，HashMap 通过 put & get 方法存储和获取。存储对象时，将 K/V 键值传给 put() 方法：①、调用

2021-06-27 17:11:56 227

原创 hive总结

Hive面试重点 —huzhan1、基础对于数据存储，Hive没有专门的数据存储格式，也没有为数据建立索引，用户可以非常自由的组织Hive中的表，只需要在创建表的时候告诉Hive数据中的列分隔符和行分隔符，Hive就可以解析数据。Hive中所有的数据都存储在HDFS中，存储结构主要包括数据库、文件、表和视图。Hive：由 Facebook 开源用于解决海量结构化

2021-06-21 11:28:30 394

原创 zookeeper总结

zookeeper面试重点1、请简述zookeeper的选举机制半数机制1）半数机制：集群中半数以上机器存活，集群可用。所以Zookeeper适合安装奇数台服务器。2）Zookeeper虽然在配置文件中并没有指定Master和Slave。但是，Zookeeper工作时，是有一个节点为Leader，其他则为Follower，Leader是通过内部的选举机制临时产生的。（假设有五台服务器组成的Zookeeper集群，它们的id从1-5，同时它们都是最新启动的，也就是没有历史数据，在存放数据量这一点上，

2021-06-15 17:00:41 114 1

原创 Hadoop总结

Hadoop面试重点一、入门1、简要描述如何安装配置apache的一个开源Hadoop1）使用root账号登入2）修改ip3）修改host主机名4）配置ssh免密登陆5)关闭防火墙6)安装jdk7)解压Hadoop安装包8)配置Hadoop的核心文件 hadoop-env.sh，core-site.xml，mapred-site.xml，hadfs-site.xml，yarn-site.xml9)配置Hadoop环境变量10）格式化hadoop namenode-format11）

2021-06-15 16:55:07 1070 2

huzhan7的博客