自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大黑牛的博客

友猿。。。。千里来相会

  • 博客(15)
  • 资源 (2)
  • 收藏
  • 关注

原创 Spark的概念、集群管理器、存储层次

本文让我们来聊一聊Spark是什么,以及涉及到的相关概念 1.1 Spark是什么             Spark 是一个用来实现快速而通用的集群计算的平台。 在速度方面,Spark 扩展了广泛使用的 MapReduce 计算模型,而且高效地支持更多计算模 式,包括交互式查询和流处理。 Spark 的一个主要特点就是能够在内存中进行计算,因而更快。不过即使是必须在磁盘上 进行的复杂...

2018-08-29 22:52:27 434

原创 Spark在Linux安装的单机--集群的不同安装模式步骤

本文包含三种模式安装:单机、Standalone、Yarn等一、单机模式 1).下载spark2.1.2.tar.gz 2).解压安装: $>cd /home/hyxy/soft/ $>cp /mnt/hgfs/2.安装环境/download/apache-spark/spark-2.1.2-bin-hadoop2.7...

2018-08-27 21:29:26 323

原创 Scala在IDEA上的安装步骤--简单

Scala 是一门多范式(multi-paradigm)的编程语言,           设计初衷是要集成面向对象编程和函数式编程的各种特性。           Scala 运行在Java虚拟机上,并兼容现有的Java程序如何安装Scala??? 1.scala是面向对象的、面向函数的基于静态类型的编程语言。 2.安装Scala,版本选型2.11.8。原因:spar...

2018-08-23 17:57:55 1070

原创 注意区分HBase与Hive之间的定义和区别

HBase              官方定义:                             Apache HBase™是Hadoop数据库,是一个分布式,可扩展的大数据存储。                         当您需要对大数据进行随机,实时读/写访问时,请使用Apache HBase™,Apache HBase是一个开源的,分布式的,      版本化的非关系...

2018-08-16 13:33:41 968

原创 Hive的静态分区 的案例操作

 hive中的分区针对{表组织}进行规划的;【静态分区】:         创建静态分区 hive>create table logs(st bigint,line string)        >partitioned by (dt string,country string)           >row format delimited fields ter...

2018-08-11 15:00:55 326

原创 Hive装载数据 、导出数据

Hive  数据操作  装载数据     既然Hive没有行级数据插入、数据更新和删除操作,那么就使用一种大量数据装载操作;     hive>load data 【local】 inpath 'hdfs://data/employees.txt'             overwrite into table employees             partition ...

2018-08-11 14:40:36 844

原创 Hive对数据库database的创建、修改

前言:Hive中对database的创建、查询、location、修改、删除等操作,作了简单描述1.创建数据库        hive>create database myhive;        hive>create database if not exists myhive;2.查询数据库和表       hive>show databases;       ...

2018-08-11 13:48:37 25336 1

原创 Hive中相关核心概念与定义

 1.什么是Hive?             Apache Hive 数据仓库软件便于读,写,和管理大型数据集驻留在分布式存储(Hadoop)使用SQL。            结构可以投影到存储中的数据上。            客户端的连接方式可采用:command line 和 JDBC Driver                 注意:Hive实质就是客户端,不存在主从...

2018-08-10 23:03:37 469

原创 开启hiveserver2服务的时候,For compliance with existing applications not using SSL the verifyServerCertifica

  前言:执行hiveserver2服务是时候报错:如下            $>hiveserver2       (或者hive --service hiveserver2 &)           18/08/09 16:36:19 WARN conf.HiveConf: HiveConf of name hive.server2.thrift.client.use...

2018-08-09 17:06:32 1332

原创 Hadoop上手动安装MySQL的方法和步骤

前言:Hadoop的基础上安装MySQL,有两种方式:在线安装和手动安装。 本文介绍:手动安装在线安装(https://blog.csdn.net/xiaozelulu/article/details/81513285)1. 手动安装 手动安装MySQL---------------------------------- 1.验证Centos是否安装MySQL ...

2018-08-08 18:55:01 5664

原创 Hadoop上在线安装MySQL的方法和步骤

前言:Hadoop的基础上安装MySQL,有两种方式:在线安装和手动安装。 本文介绍:在线安装 1. 在线安装  在线安装(MySQL)--------------------------------------------- 1.验证Centos是否安装MySQL $>yum list installed | grep mysql 2.删除M...

2018-08-08 18:25:51 3413 1

原创 Hadoop上安装Hive的步骤--易安装

Hive    1.定义:       Apache Hive 数据仓库软件便于读,写,和管理大型数据集驻留在分布式存储(Hadoop)使用SQL。       结构可以投影到存储中的数据上。       客户端的连接方式可采用:command line 和 JDBC Driver     注意:Hive实质就是客户端,不存在主从结构,搭建过程没有集群概念;    2.搭建Hiv...

2018-08-07 09:08:42 806

原创 HBase在MyEclipse常用的创建,删除,插入数据的Java代码--API

HBase在MyEclispe上执行各种API的操作         如:命名空间的创建,删除,和查询表空间                表的创建,插入数据(分为单行和多行),删除,查询(分为单行和多行,和区间查询),                 切分:分为regionname 和table                 过滤:过滤满足条件的数据项目环境:     ...

2018-08-06 19:08:28 598

原创 HBase的介绍 表结构 常用命令

HBase的表结构:这些名词的具体含义如下:1、Row Key与nosql数据库们一样,row key是用来检索记录的主键。访问hbase table中的行,只有三种方式:通过单个row key访问 通过row key的range 全表扫描Row key行键 (Row key)可以是任意字符串(最大长度是 64KB,实际应用中长度一般为 10-100bytes),在hba...

2018-08-05 20:50:52 12720

原创 HBase shell 的常用命令及语法

    HBase  shell                1.进入Hbase shell命令                        $>hbase shell               2.建议参照“help”命令                        $>help                3.shell命令                 ...

2018-08-05 09:58:59 2411

mapred-default.xml

mapred-default.xml包含一些Hadoop配置的属性和变量,里面表示的都是默认配置

2018-07-03

hadoop-2.7.6src.tar.gz的压缩包

这是关于在hadoop-2.7.6版本的.scr.tar.gz根式的压缩包

2018-07-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除