大数据
zjh_746140129
这个作者很懒,什么都没留下…
展开
-
大数据入门环境搭建整理、大数据入门系列教程合集、大数据生态圈技术整理汇总、大数据常见错误合集、大数据的离线和实时数据处理流程分析
本篇文章主要整理了笔者学习大数据时整理的一些文章,文章是从环境搭建到整个大数据生态圈的常用技术整理,环境希望可以帮助到刚学习大数据到童鞋,大家在学习过程中有问题可以随时评论回复!大数据生态圈涉及技术:Hadoop、MapReduce、HDFS、Hive、Hbase、Spark、Scala、Python、Kafka、Flume、Sqoop、Zookeeper大数据生态圈技术图: ...原创 2018-11-25 15:46:05 · 1325 阅读 · 5 评论 -
Kafka优化总结、Kafka数据丢失解决方案、重复消费解决方案
一、Kafka优化总结翻译原文如下:https://www.infoq.com/articles/apache-kafka-best-practices-to-optimize-your-deployment1. 设置日志配置参数以使日志易于管理kafka 日志文档https://kafka.apache.org/documentation/#logkafka 压缩基础知识...原创 2019-03-24 18:20:27 · 15738 阅读 · 2 评论