自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

cs的博客

一点点总计

  • 博客(5)
  • 收藏
  • 关注

原创 在windows环境中开发hadoop程序

在工作中,我们常常需要在Windows环境中开发Hadoop程序,比如使用eclipse开发MapReduce的程序等。为了方便程序的运行差错,除了程序中需要添加Hadoop的相关jar包外,还需要配置windows的本地环境。将Hadoop解压到Windows目录下:D:\software\hadoop-2.9.0注意:如果下载的Hadoop是Linux版的,那么D:\softwar...

2018-10-30 16:04:23 610

原创 hive------设计原则

1 使用分区管理HDFS文件分区避免查询数据进行HDFS全盘扫描,一个表分区数量不要太多(导致每一个分区创建一个task,每一个task是一个jvm实例),没个分区中的文件尽量大(与HDFS数据块保持一致,默认128M)2 hive反标准化传统的RDBMS有标准化,例如唯一键、主键等;hive没有主键、唯一键的概念,目标优化磁盘驱动的IO性能3 hive允许从一个表中同时向多张...

2018-10-08 23:40:27 1192

转载 数据库中导出数据到HDFS

使用sqoopsqoop import -m 1 --------m 1 使用一个MapReduce,默认4个。--connect jdbc:mysql://主机IP:3306/数据库名 --username 用户名--password 用户密码 --table 表名--columns "name,age"--where "age>18"--target-di...

2018-10-08 19:55:51 945

原创 HBase安装

HBase是一个分布式的、面向列的开源数据库:它是一个结构化数据的分布式存储系统”。HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。是nosql数据库前置环境:jdk,Hadoop,zookeeper...

2018-10-08 17:09:20 141

原创 sqoop安装

Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。前置环境:jdk,Hadoop,mysql,hbase,hive,zookeeper安装...

2018-10-08 17:09:17 156

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除