![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据知识点总结
Guangzhi_crackpot
稳健的步伐~
展开
-
HDFS,Hbase和 kudu 简单区别总结
HDFS使用列式存储格式Apache Parquet,Apache ORC,适合离线分析,不支持单条纪录级别的update操作,随机读写性能差(一次写入,多次读取)Hbase可以进行高效随机读写,却并不适用于基于SQL的数据分析方向,大批量数据获取时的性能较差KuduKUDU较好的解决了HDFS与HBASE的这些缺点,它不及HDFS批处理快,也不及HBase 随机读写能力强,但是反过来它比HBase批处理快(适用于OLAP的分析场景),而且比HDFS随机读写能力强(适用于实时写入或者更新的场景),原创 2021-03-30 12:52:13 · 1342 阅读 · 0 评论 -
大数据常用端口总结
---------zookeeper----------1、2181:对cline端提供服务2、3888:选举leader使用3、2888:集群内机器通讯使用(Leader监听此端口)-------------hadoop----------------50090:SecondaryNameNode 端口50070:NameNode 主节点 webUI 端口8020/9000: namenode active状态下的端口号10020: MapReduce 历史任务端口19888:MapR原创 2021-03-23 12:55:10 · 746 阅读 · 1 评论