自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (25)
  • 问答 (1)
  • 收藏
  • 关注

转载 Hadoop之使用LZO压缩并支持分片

1.简介:安装LZO:lzo并不是Linux系统原生支持,所以需要下载安装软件包,这里至少需要安装3个软件包。lzo, lzop, hadoop-gpl-packaging。增加索引:gpl-packaging主要作用是对压缩的lzo文件创建索引,否则的话,无论压缩的文件是否大于hdfs上的block大小,都只会是一个分片处理。2.安装lzo并生成数据:2.1生成未压缩的测试数据先生成一个大于128M的测试数据,这样在使用lzo压缩后就能保证压缩文件大小大于数据块大小,方便后续测试分

2021-09-22 22:39:49 858

转载 HIVE Parquet格式+snappy压缩及ORC格式+snappy压缩文件的方式

一.使用Parquet存储数据数据使用列存储之前是普通的行存储,下面是行存储的的文件大小,这个HDFS上的数据使用parquet列存储,可以将文件的大小减小化。下面具体讲parquet存储数据的代码以及加载数据的格式。数据库代码:create table if not exists db_yhd.track_log_parquet(id STRING,url STRING,referer STRING,keyword.

2021-09-22 22:24:35 4944

原创 LzoCodec和LzopCodec的区别

使用LZO过程会发现它有两种压缩编码可以使用,即LzoCodec和LzopCodec,下面说说它们区别:LzoCodec比LzopCodec更快, LzopCodec为了兼容LZOP程序添加了如bytes signature, header等信息 如果使用LzoCodec作为Reduce输出,则输出文件扩展名为".lzo_deflate",它无法被lzop读取;如果使用LzopCodec作为Reduce输出,则扩展名为".lzo",它可以被lzop读取 生成lzo index job的”Dist..

2021-09-22 19:44:34 353

转载 Mapreduce 指定参数

mapreduce在运行的时候可以指定各种参数,这样可以根据实际的应用场景做一下相关的调整1.指定运行时cpu的个数hadoop jar hadoop-core-0.1.0-SNAPSHOT.jar cn.hadoop.mapreduce.WordCount -D mapreduce.map.cpu.vcores=2 /home/input /home/output-D mapreduce.map.cpu.vcores=2 :指定这个mapreduce任务运行时cpu的个数/home/i.

2021-09-13 22:43:33 628

EBS 测试移植生产自动生成脚本程序

值集,并发请求,功能,菜单,快码等

2023-03-15

jdk-8u281-windows-x64.rar

jdk-8u281-windows-x64.rar

2021-03-05

史上最牛逼pdf转word工具(推荐)

史上最牛逼pdf转word工具,带目录转换

2020-07-10

PDF转Word 地表最强

PDF转Word工具 地表最强。

2020-06-28

netty-websocket-proxy-1.3.2-bin .zip

netty-websocket-proxy-1.3.2-bin .zip。

2020-06-04

jdk-8u241-windows-x64.rar

jdk-8u241-windows-x64.rar。

2020-05-26

netty-websocket-proxy-1.3.1-bin.zip

netty-websocket-proxy-1.3.1-bin.zip

2020-05-20

netty-websocket-proxy-1.3.0.zip

netty-websocket-proxy-1.3.0.zip。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

2020-04-27

hbase-1.3.6-bin.tar.gz

hbase-1.3.6-bin.tar....

2020-04-19

commons-codec.jar commons-lang.jar

commons-codec.jar commons-lang.jar...............................................

2018-05-07

Linux命令大全(修改版).chm

Linux命令大全(修改版).chm 拿走,,,,,,,,,,,

2018-04-20

卷积神经网络CNN代码解析-matlab.doc

卷积神经网络CNN代码解析-matlab.doc,,,,,,,,

2018-04-20

Android+API+docs_all.rar

Android+API+docs_all.rar 不说了拿去,,,不保留,,,

2018-04-20

HTML5 参考手册.chm

HTML5 参考手册.chm。。。。。。。。。。。。。。。。。。。。。

2018-04-20

项目管理过程PPt

项目管理过程PPt,向往项目经理发展的网友可以了解下,,,,,,,,

2018-04-17

项目管理章程及干系人登记册模板

项目管理章程及干系人登记册模板,,,,,,,,,,,,

2018-04-17

Android官方API文档完整版.rar

Android官方API文档完整版.rar 很好用 我现在就在用

2018-04-09

FSCapture_7.3_XiaZaiBa.rar 尺子工具

FSCapture_7.3_XiaZaiBa.rar 尺子工具,,,,,,,,,

2018-04-09

Caffe官方教程中译本

Caffe官方教程中译本。。。。。。。。。。。。。。。。。

2018-04-07

16款java游戏源码

16款java游戏源码。。。。。。。。。。。。。。。。。。。

2018-04-01

人工智能八数码问题求解(b/s架构)

本项目为实现八数码问题求解。采用 jsp+struts1 实现 bs 架构,前端通过 jsp 显示界面,后台通过Java 类封装核心算法。

2018-03-26

javaweb,php开发手册全

javaweb,php开发手册全,,,,,,,,,,,,,,,

2017-11-02

多媒体实验报告

多媒体实验报告,,,,,,,,,,,,,,,,,,,,

2017-11-02

java web 实验报告

java web 实验报告,,,,,,,,,,,,,,,,,

2017-11-02

java php 后台前端开发各种手册

java php 后台前端开发各种手册

2017-05-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除