![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
面试总结
文章平均质量分 62
墨小柒
请多多指教。Q:376655517欢迎交流学习
展开
-
面试题总结--kafka
面试题总结–kafka文章目录面试题总结--kafka1. kafka topic数量过多对kafka有什么影响2. kafka的ISR副本同步队列3. kafka如何保证精准一次消费1. kafka topic数量过多对kafka有什么影响问题:topic数量过多,会导致总分区数很多,磁盘读写退化为随机,影响性能解决方案:2. kafka的ISR副本同步队列ISR(In-Sync Replicas),副本同步队列。ISR 中包括 Leader 和 Follower。如果 Leader进程挂掉原创 2021-03-04 18:13:13 · 303 阅读 · 1 评论 -
面试题总结--Hadoop
面试题总结–Hadoop文章目录面试题总结--Hadoop1. Hadoop常用端口号2. HDFS读流程和写流程1. Hadoop常用端口号组件节点默认端口配置用途说明HDFSDataNode50010dfs.datanode.addressdatanode服务端口,用于数据传输HDFSDataNode50075dfs.datanode.http.addresshttp服务的端口HDFSDataNode50475dfs.datanode.h原创 2021-03-03 18:50:03 · 166 阅读 · 0 评论 -
面试题总结--Linux&Shell相关
面试题总结–Spark (持续更新ing…)文章目录面试题总结--Spark (持续更新ing......)1.Linux常用命令1.Shell常用工具1.Linux常用命令序号命令命令解释1top查看内存2df -h查看磁盘存储情况3iotop查看磁盘IO读写4iotop -o直接查看比较高的磁盘读写程序5netstat -tunlp | grep 端口号查看端口占用情况6uptime查看报告系统运行时长及平均负载原创 2021-03-02 15:38:32 · 196 阅读 · 0 评论 -
面试题总结--Spark (持续更新ing......)
面试题总结–Spark (持续更新ing…)文章目录面试题总结--Spark (持续更新ing......)1. spark中的RDD是什么,有哪些特性?1. 宽依赖与窄依赖1. spark中的RDD是什么,有哪些特性?RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合1. 宽依赖与窄依赖窄依赖就是一个父RDD分区对应一个子RDD分区,如map,filter或者多个父RD原创 2021-01-28 18:57:50 · 164 阅读 · 0 评论