CDH6.3.2 在线安装 hadoop Lzo压缩

 

1 查看我的hadoop支撑的压缩方式

hdfs 配置控制台收索: io.compression.codecs

可见没有LzopCodec方式

CDH中默认不支持Lzo压缩编码,需要下载额外的Parcel包,才能让Hadoop相关组件如HDFS,Hive,Spark支持Lzo编码。

2 LzoCodec和LzopCodec区别

LzoCodec和LzopCodec区别

两种压缩编码LzoCodec和LzopCodec区别:
    1. LzoCodec比LzopCodec更快, LzopCodec为了兼容LZOP程序添加了如 bytes signature, header等信息。
    2. LzoCodec作为Reduce输出,结果文件扩展名为 ”.lzo_deflate” ,无法被lzop读取;使用LzopCodec作为Reduce输出,生成扩展名为 ”.lzo” 的文件,可被lzop读取。
    3. LzoCodec结果(.lzo_deflate文件) 不能由 lzo index job 的 "DistributedLzoIndexer" 创建index。
    4. “.lzo_deflate” 文件不能作为MapReduce输入。而这些 “.LZO” 文件都支持。
        综上所述,map输出的中间结果使用LzoCodec,reduce输出使用 LzopCodec。

另外:org.apache.hadoop.io.compress.LzoCodec和com.hadoop.compression.lzo.LzoCodec功能一样,都是源码包中带的,生成的都是 lzo_deflate 文件。

3  在线Parcel安装Lzo

3.1 下载地址:修改6.x.x为对应版本
 
CDH6:https://archive.cloudera.com/gplextras6/6.x.x/parcels/ 

我的版本是 CDH6.3.1 所以我的下载地址就是

https://archive.cloudera.com/gplextras6/6.3.1/parcels/

在CDH的 Parcel 配置中,“远程Parcel存储库URL”,点击 “+” 号,添加地址栏

返回Parcel列表 可能需要一段时间会看到 GPLEXTRAS 因为国外的网站可能我们的网络连接比较延迟

3.2 下载

点击:Download

分配 

激活

激活成功

 3.3 为HDFS添加压缩编码解码器

hdfs 配置控制台收索: io.compression.codecs

点击 “+” 号添加:

com.hadoop.compression.lzo.LzoCodec
com.hadoop.compression.lzo.LzopCodec

3.4  YARN配置自动加载GPLEXTRAS下的包

① 找到自己刚才安装的GPLEXTRAS目录

/opt/cloudera/parcels/GPLEXTRAS/lib/hadoop/lib

②配yarn

收索:mapreduce.application.classpath

② 添加/opt/cloudera/parcels/GPLEXTRAS/lib/hadoop/lib/*

 ③ 更新配置重启服务

 然后完成

. ├── CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel ├── CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1 ├── CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha256 ├── GPLEXTRAS-parcels │   ├── GPLEXTRAS-6.3.2-1.gplextras6.3.2.p0.1605554-el7.parcel │   ├── GPLEXTRAS-6.3.2-1.gplextras6.3.2.p0.1605554-el7.parcel.sha1 │   ├── GPLEXTRAS-6.3.2-1.gplextras6.3.2.p0.1605554-el7.parcel.sha256 │   └── manifest.json ├── allkeys.asc ├── cm6.3.1 │   ├── RPM-GPG-KEY-cloudera │   ├── RPMS │   │   ├── noarch │   │   └── x86_64 │   │   ├── cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm │   │   ├── cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm │   │   ├── cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm │   │   ├── cloudera-manager-server-db-2-6.3.1-1466458.el7.x86_64.rpm │   │   ├── enterprise-debuginfo-6.3.1-1466458.el7.x86_64.rpm │   │   └── oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm │   ├── SRPMS │   └── repodata │   ├── 3662f97de72fd44c017bb0e25cee3bc9398108c8efb745def12130a69df2ecb2-filelists.sqlite.bz2 │   ├── 43f3725f730ee7522712039982aa4befadae4db968c8d780c8eb15ae9872cd4d-primary.xml.gz │   ├── 49e4d60647407a36819f1d8ed901258a13361749b742e3be9065025ad31feb8e-filelists.xml.gz │   ├── 8afda99b921fd1538dd06355952719652654fc06b6cd14515437bda28376c03d-other.sqlite.bz2 │   ├── b9300879675bdbc300436c1131a910a535b8b5a5dc6f38e956d51769b6771a96-primary.sqlite.bz2 │   ├── e28836e19e07f71480c4dad0f7a87a804dc93970ec5277ad95614e8ffcff0d58-other.xml.gz │   ├── repomd.xml │   ├── repomd.xml.asc │   └── repomd.xml.key └── manifest.json
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值