公司需要增加对hdfs集群数据安全的控制,组里有人提出apach ranger可以完成数据动态模糊和hdfs目录,hive表的动态访问控制,因此尝试了下apach ranger相关的功能,并碰到了不少坑。
Ranger 是hortonworks收购XA后开源出来的项目,现在还属于项目孵化阶段,用的人不多,国内只找到两篇安装指南,第一篇写的比较详细,针对的是ranger 0.5版本,我就是参照这个安装指南安装的,第二篇比较简略,但是针对的是最新的ranger 0.6版本。
国外的用户也基本集中在hortonwork推出的平台工具上,而国内使用horton works工具平台的应该不多,所以相关文档稀少。
本文主要记录我在试用ranger 0.5和ranger 0.6的过程中遇到的坑,不再赘述安装过程。
一.兼容性
刚开始使用的时候,由于官方的安装指南还是基于ranger 0.5的,所以我首先下载编译的是ranger 0.5版本,由于maven服务器连接缓慢,所以编译时常time out。后来尝试使用