大数据
能吃黄金
这个作者很懒,什么都没留下…
展开
-
flume和nginx相关配置和实现
Nginx (engine x) 是一个高性能的HTTP和反向代理web服务器 欢迎使用Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增...原创 2019-10-15 16:22:50 · 449 阅读 · 0 评论 -
大数据-从flume采集数据通过kafaka下沉到hive表的一个详细案列
HDFS 实施前的准备 安装nginx 安装flume 安装kafka 打jar包 双击package即可打成jar包 在此处可以看到打成jar包的地址 将jar包运行在虚拟机上 我准备了四台虚拟机 我将jar包 ...原创 2019-10-24 12:21:05 · 871 阅读 · 1 评论 -
storm集群一键启动关闭shell脚本文件
storm一键启动脚本 在storm/bin目录下,touch start-storm-cluster.sh,并加上权限chmod a+x start-storm-cluster.sh vi start-storm-cluster.sh 这里面需要注意的是: hdp-1 hdp-2 hdp-3是我的三台虚拟机,如果名字不同需要修改 此脚本必须放在storm/bin方能生效 #!/bin/b...原创 2019-10-25 12:35:51 · 175 阅读 · 0 评论 -
最详细的flume概念理解和配置及命令详解
1、概念 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 flume可以采集文件,socket数据包、文件、文件夹、kafka等各种形式源数据,有可以将采集到的数据(下沉sink)输出到HDFS、hbase、hive、kafka等众多外部存储系统中。 一般的采集需求。通过对flume的简单配置即可实现flume针对特殊场景也具备良好的自定义扩展能力,因此,flume可以适...原创 2019-11-09 10:04:36 · 1251 阅读 · 0 评论