一般而言对于手工配置版本的cdh需要手工修改各种xml或者.sh的文档来配置集群中的相关参数,但是缺点是速度很慢效率相对较低,优点是在国内这一方面的资料成熟可以参考的文档也比较多,所以遇到问题也相对容易解决。但是对于用cm版本的部署相对容易,cm的自动化安装已经帮助我们解决了大多数的问题,对于节点比较多的机器集群,使用cm是一个很好的选择。但是在实际的过程当中由于cm的目录结构本身很不一样,比如服务的依赖包配置问题。
1、服务端的依赖包
[plain] view plaincopy
/usr/share/cmf/lib/
只需把相关第三方包上传到此路径即可,如cm依赖的JDBC包,上传到此路径
2、客户端的依赖包
[plain] view plaincopy
/opt/cloudera/parcels/CDH/lib/hive/lib/
只需把相关第三方包上传到此路径即可,这里以hive为例
如果程序需要运行hbase客户端代码,那么就需要将hbase的/opt/cloudera/parcels/CDH/lib/hbase/lib/ 的代码拷贝到hadoop中去。
参考链接:https://blog.csdn.net/kwu_ganymede/article/details/49097631