- 博客(6)
- 收藏
- 关注
原创 Flume总结
Flume总结 --huzhan1、 你是如何实现Flume数据传输的监控的使用第三方框架 Ganglia 实时监控 Flume。2 、Flume的 Source,Sink,Channel的作用?你们 Source是什么类型?1、作用(1)Source 组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括 avro、thrift、exec、jms、spooling directory、netcat、sequence g
2021-07-16 00:57:47 912
原创 Hbase总结
Hbase总结 --huzhan一、Hbase的六大特点:(1)、表大:一个表可以有数亿行,上百万列。(2)、无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一个表中的不同行的可以有截然不同的列。(3)、面向列:HBase是面向列的的存储和权限控制,列族独立索引。(4)、稀疏:空(null)列并不占用空间,表可以设计的
2021-06-30 14:19:26 1482
转载 HashMap总结
1:HashMap 的数据结构?A:哈希表结构(链表散列:数组+链表)实现,结合数组和链表的优点。当链表长度超过 8 时,链表转换为红黑树。transient Node<K,V>[] table;2:HashMap 的工作原理?HashMap 底层是 hash 数组和单向链表实现,数组中的每个元素都是链表,由 Node 内部类(实现 Map.Entry接口)实现,HashMap 通过 put & get 方法存储和获取。存储对象时,将 K/V 键值传给 put() 方法:①、调用
2021-06-27 17:11:56 227
原创 hive总结
Hive面试重点 —huzhan1、基础对于数据存储,Hive没有专门的数据存储格式,也没有为数据建立索引,用户可以非常自由的组织Hive中的表,只需要在创建表的时候告诉Hive数据中的列分隔符和行分隔符,Hive就可以解析数据。Hive中所有的数据都存储在HDFS中,存储结构主要包括数据库、文件、表和视图。Hive:由 Facebook 开源用于解决海量结构化
2021-06-21 11:28:30 394
原创 zookeeper总结
zookeeper面试重点1、请简述zookeeper的选举机制半数机制1)半数机制:集群中半数以上机器存活,集群可用。所以Zookeeper适合安装奇数台服务器。2)Zookeeper虽然在配置文件中并没有指定Master和Slave。但是,Zookeeper工作时,是有一个节点为Leader,其他则为Follower,Leader是通过内部的选举机制临时产生的。(假设有五台服务器组成的Zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,
2021-06-15 17:00:41 114 1
原创 Hadoop总结
Hadoop面试重点一、入门1、简要描述如何安装配置apache的一个开源Hadoop1)使用root账号登入2)修改ip3)修改host主机名4)配置ssh免密登陆5)关闭防火墙6)安装jdk7)解压Hadoop安装包8)配置Hadoop的核心文件 hadoop-env.sh,core-site.xml,mapred-site.xml,hadfs-site.xml,yarn-site.xml9)配置Hadoop环境变量10)格式化hadoop namenode-format11)
2021-06-15 16:55:07 1070 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人