自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

开开心心

好好工作,学习关注自己感兴趣的领域,享受生活

  • 博客(8)
  • 资源 (6)
  • 收藏
  • 关注

原创 Hadoop(五) HDFS 序列化 压缩 存储文件类型

目录Hadoop 序列化Hadoop序列化定义步骤示例Hadoop 压缩为什么要在Hadoop中引入压缩Hadoop 支持的压缩类别各种压缩方式详解Gzip压缩lzo压缩snappy压缩bzip2压缩压缩参数配置存储文件类型SequenceFileSequenceFile简介SequenceFile 文件的结构SequenceFi...

2019-11-17 11:58:53 423

转载 Snappy安装

1. 功能说明使用snappy压缩来提升mapreduce和hbase的性能。其实就是用CPU换IO吞吐量和磁盘空间。配置并使用snappy有如下几点要求:首先需要hadoop集群的native库已经收到编译好,并且添加了对snappy的支持。编译hadoop源码之前安装了snappy并且编译时指定-Drequire.snappy参数。(我使用的版本是hadoop-2.5.0-cdh5....

2019-11-17 11:26:25 3119

转载 LZO的安装

hadoop-lzo的安装:----------------------1.本地库的安装 获取到安装包lzo-2.10.tar.gz 后 执行下列命令: tar -zxvf lzo-2.06.tar.gz -C /opt/tool/ cd /opt/tool/lzo-2.06/ ...

2019-11-17 11:21:11 1627

原创 Hadoop(四) MapReduce 原理

目录MapReduce的核心思想Hadoop MapReduceInputFormatTextInputFormatKeyValueTextInputFormatNLineInputFormat自定义InputFormatJob提交过程FileInputFormat切片大小的参数配置获取切片信息APIMapTask的个数Partitioner默...

2019-11-16 23:42:23 997

原创 Hadoop(三) HDFS 使用

目录准备工作HDFS API的使用org.apache.hadoop.fs.FileSystemorg.apache.hadoop.fs.Pathorg.apache.hadoop.fs.FsStatusorg.apache.hadoop.fs.FileStatusorg.apache.hadoop.fs.FSDataInputStreamorg.apache.ha...

2019-11-16 07:52:44 932

原创 Hadoop(二) HDFS 底层原理解析

目录HDFS概念HDFS优缺点优点缺点HDFS 架构/角色Client:客户端NameNode:master,它是一个主管、管理者DataNodeSecondary NameNodehdfs启动过程启动脚本分析HDFS启动过程--源码分析HDFS 文件块大小HDFS的元数据管理NameNode 元数据存储机制查看编辑日志hdfs...

2019-11-14 23:18:49 1714

原创 mysql 运算符,常用函数

mysql常用函数介绍参考:http://c.biancheng.net/mysql/function/目录MySQL 运算符数值型函数mysql字符串函数myslq日期和时间函数mysql聚合函数mysql流程控制函数MySQL 运算符算术运算符+ 加法- 减...

2019-11-13 16:48:26 499

原创 mysql 基础操作

mysql是一种常用的数据库,基本使用见下参考:http://c.biancheng.net/mysql/库操作 1.创建 create database db2 charset utf8; 2.删除库 drop database db2; 3.使用(进入) use db2; 4.查看库 show databases; 查看数...

2019-11-13 16:46:11 205

shell 编程入门到精通

shell 编程是大数据下管理集群不可缺少的技能,能让管理者提高工作效率

2019-02-21

hadooop 权威指南4

hadoop 实战,详细描述了hadoop的整个生态圈。从hadoop集群的搭建,到mapreduce的开发

2019-02-21

mysql 调优技巧

mysql 调优技巧,深入mysql 语言,数据类型的细节。适合有一定数据库基础的专业人员

2018-02-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除