ambari
文章平均质量分 80
飄落
这个作者很懒,什么都没留下…
展开
-
Spark实现流式实时日志分析系统
实验介绍 我们知道对于一个网站的用户访问流量是不间断的,基于网站的访问日志,即WEB LOG的分析是经典的流式实时计算应用场景。比如百度统计,它可以做流量分析、来源分析、网站分析、转化分析。另外还有特定场景分析,比如安全分析,用来识别 CC 攻击、 SQL 注入分析、脱库等。这里我们简单实现一个类似于百度分析的系统。 课程来源 这里的课程来自于【实验楼课程】:流式实时日志分析系统——《Spa...转载 2018-10-31 17:53:12 · 3043 阅读 · 0 评论 -
ambari Kafka Shell基本命令(包括topic的增删改查)
创建kafka topic ./bin/kafka-topics.sh --create --zookeeper node7:2181,node5:2181,node6:2181 --replication-factor 1 --partitions 3 --topic test 注: partitions指定topic分区数,replication-factor指定topic每个分区的...原创 2018-11-28 23:09:11 · 1030 阅读 · 0 评论 -
大数据服务节点配置参考
原创 2019-01-26 12:00:06 · 1537 阅读 · 0 评论