自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_32445015的博客

12月 09月 08月 06月 05月 03月 01月

转载 Hadoop之使用LZO压缩并支持分片

1.简介：安装LZO:lzo并不是Linux系统原生支持，所以需要下载安装软件包，这里至少需要安装3个软件包。lzo, lzop, hadoop-gpl-packaging。增加索引：gpl-packaging主要作用是对压缩的lzo文件创建索引，否则的话，无论压缩的文件是否大于hdfs上的block大小，都只会是一个分片处理。2.安装lzo并生成数据：2.1生成未压缩的测试数据先生成一个大于128M的测试数据，这样在使用lzo压缩后就能保证压缩文件大小大于数据块大小，方便后续测试分

2021-09-22 22:39:49 858

转载 HIVE Parquet格式+snappy压缩及ORC格式+snappy压缩文件的方式

一.使用Parquet存储数据数据使用列存储之前是普通的行存储，下面是行存储的的文件大小，这个HDFS上的数据使用parquet列存储，可以将文件的大小减小化。下面具体讲parquet存储数据的代码以及加载数据的格式。数据库代码：create table if not exists db_yhd.track_log_parquet(id STRING,url STRING,referer STRING,keyword.

2021-09-22 22:24:35 4944

原创 LzoCodec和LzopCodec的区别

使用LZO过程会发现它有两种压缩编码可以使用，即LzoCodec和LzopCodec，下面说说它们区别：LzoCodec比LzopCodec更快， LzopCodec为了兼容LZOP程序添加了如bytes signature, header等信息如果使用LzoCodec作为Reduce输出，则输出文件扩展名为".lzo_deflate"，它无法被lzop读取；如果使用LzopCodec作为Reduce输出，则扩展名为".lzo"，它可以被lzop读取生成lzo index job的”Dist..

2021-09-22 19:44:34 353

转载 Mapreduce 指定参数

mapreduce在运行的时候可以指定各种参数，这样可以根据实际的应用场景做一下相关的调整1.指定运行时cpu的个数hadoop jar hadoop-core-0.1.0-SNAPSHOT.jar cn.hadoop.mapreduce.WordCount -D mapreduce.map.cpu.vcores=2 /home/input /home/output-D mapreduce.map.cpu.vcores=2 ：指定这个mapreduce任务运行时cpu的个数/home/i.

2021-09-13 22:43:33 628

EBS 测试移植生产自动生成脚本程序

值集，并发请求，功能，菜单，快码等

2023-03-15

jdk-8u281-windows-x64.rar

jdk-8u281-windows-x64.rar

2021-03-05

史上最牛逼pdf转word工具（推荐）

史上最牛逼pdf转word工具，带目录转换

2020-07-10

PDF转Word 地表最强

PDF转Word工具地表最强。

2020-06-28

netty-websocket-proxy-1.3.2-bin .zip

netty-websocket-proxy-1.3.2-bin .zip。

2020-06-04

jdk-8u241-windows-x64.rar

jdk-8u241-windows-x64.rar。

2020-05-26

netty-websocket-proxy-1.3.1-bin.zip

netty-websocket-proxy-1.3.1-bin.zip

2020-05-20

netty-websocket-proxy-1.3.0.zip

netty-websocket-proxy-1.3.0.zip。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

2020-04-27

hbase-1.3.6-bin.tar.gz

hbase-1.3.6-bin.tar....

2020-04-19

commons-codec.jar commons-lang.jar

commons-codec.jar commons-lang.jar...............................................

2018-05-07

Linux命令大全(修改版).chm

Linux命令大全(修改版).chm 拿走，，，，，，，，，，，

2018-04-20

卷积神经网络CNN代码解析-matlab.doc

卷积神经网络CNN代码解析-matlab.doc，，，，，，，，

2018-04-20

Android+API+docs_all.rar

Android+API+docs_all.rar 不说了拿去，，，不保留，，，

2018-04-20

HTML5 参考手册.chm

HTML5 参考手册.chm。。。。。。。。。。。。。。。。。。。。。

2018-04-20

项目管理过程PPt

项目管理过程PPt，向往项目经理发展的网友可以了解下，，，，，，，，

2018-04-17

项目管理章程及干系人登记册模板

项目管理章程及干系人登记册模板，，，，，，，，，，，，

2018-04-17

Android官方API文档完整版.rar

Android官方API文档完整版.rar 很好用我现在就在用

2018-04-09

FSCapture_7.3_XiaZaiBa.rar 尺子工具

FSCapture_7.3_XiaZaiBa.rar 尺子工具，，，，，，，，，

2018-04-09

Caffe官方教程中译本

Caffe官方教程中译本。。。。。。。。。。。。。。。。。

2018-04-07

16款java游戏源码

16款java游戏源码。。。。。。。。。。。。。。。。。。。

2018-04-01

人工智能八数码问题求解（b/s架构）

本项目为实现八数码问题求解。采用 jsp+struts1 实现 bs 架构，前端通过 jsp 显示界面，后台通过Java 类封装核心算法。

2018-03-26

javaweb，php开发手册全

javaweb，php开发手册全，，，，，，，，，，，，，，，

2017-11-02

多媒体实验报告

多媒体实验报告，，，，，，，，，，，，，，，，，，，，

2017-11-02

java web 实验报告

java web 实验报告，，，，，，，，，，，，，，，，，

2017-11-02

java php 后台前端开发各种手册

java php 后台前端开发各种手册

2017-05-11

HDFS 使用关系型数据库存储管理元数据是不是更有优势

2021-12-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除