数据仓库
Thomas_White
这个作者很懒,什么都没留下…
展开
-
数据仓库项目——业务数据生成
使用MySQL链接工具链接MySQL(我使用的是Navicat)创建一个名为gmall的数据库导入SQL脚本生成对应的表以及数据文件已分享,可自行下载链接: https://pan.baidu.com/s/1rrbM4FGChktr3wQxm8QN7g提取码: 5x8e生成业务数据在/opt/module/创建一个db_log文件夹mkdir db_log/上传gmall-mock-db-2020-03-16-SNAPSHOT.jar 和 application.propert原创 2020-06-23 15:02:13 · 650 阅读 · 0 评论 -
Flume拦截器
LogETLInterceptorpackage com.atguigu.flume.interceptor;import org.apache.flume.Context;import org.apache.flume.Event;import org.apache.flume.interceptor.Interceptor;import java.nio.charset.Charset;import java.util.ArrayList;import java.util.List;.原创 2020-05-13 09:48:32 · 242 阅读 · 0 评论 -
数据仓库项目——数据准备
使用idea编写,模拟数据产生pom.xml <!--版本号统一--> <properties> <slf4j.version>1.7.20</slf4j.version> <logback.version>1.0.7</logback.version> </properties> <dependencies> <!--原创 2020-05-13 09:45:30 · 362 阅读 · 1 评论 -
数据仓库项目——集群搭建
1.虚拟机三台2.jdk环境变量jdk版本:jdk-8u144-linux-x64.tar环境变量配置/etc/profile.d/env.sh#JAVA_HOME export JAVA_HOME=/opt/module/jdk1.8.0_144 export PATH=$PATH:$JAVA_HOME/bin配置完需要source /etc/profile.d/env.shHadoop环境变量Hadoop版本:hadoop-2.7.2.tar环境变量配置/etc/profile.d原创 2020-05-10 08:38:17 · 452 阅读 · 0 评论