创建项目
准备pom.xml文件配置(附在文档最后)
在下载jar过程中极其缓慢,简直不能忍受,查阅了下资料,得到下面的办法:
1、 maven仓库中没有支持cdh的相关依赖。cloudera自己建立了一个相关的仓库。要想利用maven添加相关依赖,则必须单独添加cloudera仓库
![c1943ddab099667230113b36f0ae35d7.png](https://i-blog.csdnimg.cn/blog_migrate/2561c102ad13bb353a35bce8063518c6.jpeg)
2、 在国内使用maven中央仓库一般会有网络问题,大部分人会使用aliyun仓库或者其他开源的仓库。所以需要修改setting.xml (以下配置中 *,!cloudera 表示除了aliyun仓库还使用cloudera仓库)
配置:
nexus-aliyun *,!cloudera Nexus aliyun http://maven.aliyun.com/nexus/content/groups/public
![d909d51dc563414e73de586629a09b38.png](https://i-blog.csdnimg.cn/blog_migrate/5e217881ed963d136c65ee3bdb255049.jpeg)
配置环境
下面两个配置表示是在本地运行还是到Linux环境中运行
dev
![5782ca940a6634f7c855d63d83d0553d.png](https://i-blog.csdnimg.cn/blog_migrate/6c39dd8c5b8485ebb5d657b280029b16.jpeg)
编写内容
![568c307001639b7584a9cf6e9e09abf8.png](https://i-blog.csdnimg.cn/blog_migrate/d11e384fdd516f8281e1d9232b668675.jpeg)
local
![38827ff23da7ff75d7fcf09360a8d07d.png](https://i-blog.csdnimg.cn/blog_migrate/7bfdec5e90a5da7e7898279eac5bf4f7.jpeg)
编写内容
![4fa518b93d4b2a5f2d4452992a143b59.png](https://i-blog.csdnimg.cn/blog_migrate/fa5437bbbe0f45bc2236ea13c943be0d.jpeg)
准备log4j的日志配置,这个网上很多,可以直接复制一份,改下关键地方就可以
![fe13d18d933107fb5036290368ff9c4b.png](https://i-blog.csdnimg.cn/blog_migrate/692029b326ed295cda5c904bbc4bbe63.jpeg)
HDFS连接地址的配置
![cac3a14d241e8c13734625ed32c084b8.png](https://i-blog.csdnimg.cn/blog_migrate/1eed87cde0d5e31e7d5b3eaca20fdfe0.jpeg)
Hbase的连接配置
![89803670b5728806fb62e67b85223718.png](https://i-blog.csdnimg.cn/blog_migrate/5b4f8c802831610f695764723bb9e479.jpeg)
配置文件transformer-env.xml
![7cbbf210fa99177aad3a92dff901d9d8.png](https://i-blog.csdnimg.cn/blog_migrate/0d8103dba8afed7083736f5013854c6b.jpeg)
文件内容
![29df5fd5caae3a322166b761ab5c6346.png](https://i-blog.csdnimg.cn/blog_migrate/837f021e8ca5e43d8bfbb9bd2bcfbd94.jpeg)
![4df5f56aa1010030599e857b55ce602b.png](https://i-blog.csdnimg.cn/blog_migrate/f2c260cd8f56fa824c46defa5d36047e.jpeg)
pom.xml文件配置
4.0.0 com.xlgl.wzy localenv 0.0.1-SNAPSHOT 2.7.3 1.2.5 2.1.1 5.1.6 2.6.2 0.6.1 aliyun http://maven.aliyun.com/nexus/content/groups/public/ cloudera https://repository.cloudera.com/artifactory/cloudera-repos/ jboss http://repository.jboss.org/nexus/content/groups/public org.apache.hadoop hadoop-client ${hadoop.version} org.apache.hbase hbase-client ${hbase.version} org.apache.hbase hbase-server ${hbase.version} org.apache.hive hive-exec ${hive.version} mysql mysql-connector-java ${mysql.version} cz.mallat.uasparser uasparser ${uasparser.version} com.google.code.gson gson ${gson.version} local true configuration/local src/main/resources org.codehaus.mojo build-helper-maven-plugin 1.4 add-source generate-sources add-source ${basedir}/src/main/java ${basedir}/src/main/extr dev configuration/dev src/main/resources org.codehaus.mojo build-helper-maven-plugin 1.4 add-source generate-sources add-source ${basedir}/src/main/java org.apache.maven.plugins maven-shade-plugin 2.1 package shade cz.mallat.uasparser:uasparser net.sourceforge.jregex:jregex mysql:mysql-connector-java src/test/java maven-assembly-plugin jar-with-dependencies make-assembly package assembly maven-compiler-plugin 3.3 1.8 1.8 utf8 org.eclipse.m2e lifecycle-mapping 1.0.0 org.codehaus.mojo build-helper-maven-plugin [1.4,) add-source