自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (15)
  • 收藏
  • 关注

原创 Spark-2.2.0集群搭建

下载spark-2.2.0:下载地址  点击进入下载地址加压spark-2.2.0tar -zxfv  spark-2.2.0-bin-hadoop2.77.tgz配置环境变量export SPARK_HOME=/usr/local/soft/spark-2.2.0export PATH=$SPARK_HOME/bin:$PATH修改配置文件[hadoop@maste...

2018-07-22 13:19:30 196

原创 Scala中的环境搭建和HelloScala的解析

用IDEA进行Scala的开发安装JDK1.8版本以上在window中配置Scala的环境变量和Jdk的环境变量Jdk的环境配置JAVA_HOMEC:\Program Files\Java\jdk1.8.0_131Scala的环境配置SCALA_HOMED:\scala-2.11.8验证安装是否成功Idea中安装Scala的插件1、找到与Intelli...

2018-07-22 13:18:37 212

原创 Kafka集群搭建(三台)

解压kafka_2.11-0.10.0.1.tgz解压:tar -zxvf kafka_2.11-0.10.0.1.tgz配置环境变量配置环境变量vi ~/.bashrcexport KAFKA_HOME=/usr/local/soft/kafkaexport PATH=${PATH}:${KAFKA_HOME}/binscp ~/.bashrc slave1:~/.bashrcscp...

2018-07-09 18:31:13 2804

原创 Flume --Source

 使用avro源:监听Avro端口并从外部Avro客户端流接收事件。当与另一个(前一跳)水槽代理上的内置Avro接收器配对时,它可以创建分层集合拓扑。1.配置flume【avro_r.conf】#comonentsa1.sources = r1a1.sinks = s1a1.channels = c1#sourcea1.sources.r1.type = avroa1.source...

2018-07-09 10:39:07 166

原创 AsyncHBaseSink(此接收器使用异步模型将数据写入HBase)

                                    AsyncHBaseSink在hbase中创建表 t1 列族 f1hbase(main):006:0> create 't1','f1'0 row(s) in 1.2980 seconds=> Hbase::Table - t1hbase(main):007:0> listTABLE ...

2018-07-08 11:55:40 1129

原创 Flume的简单介绍

要想使用Flume,就需要运行Flume代理。Flume代理是由持续运行的sorce(数据来源)、sink(数据目标)以及channei(用干连接sours。和sink)构成的Java进程。Flume的source产生事件,并将其传送给channel , channel存储这些事件直至转发给sink。可以把source-channel-sink的组合视为基本Flume构件  Collector的作...

2018-07-08 09:44:46 16395

原创 Flume - HDFS Sink(数据的目的地为HDFS)

一:flume介绍        Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。,Flume架构分为三个部分 源-Source,接收器-Sink,通道-Channel。flume--------------------- agent(主件): source :收...

2018-07-08 09:33:28 2697

转载 HBASE---Java API编程实例

创建maven工程pom.xml<dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-client</artifactId> <version>1.3.1</version></dependenc

2018-07-06 12:18:48 521

原创 hbase在zookeeper中的数据结构

查看hbase在zookeeper中的数据结构(这一个小的知识点很多人都会忽略)几个比较主要的下面有解释replication, meta-region-server, rs,          节点数   splitWAL,     日志文件backup-masters, table-lock, flush-table-proc, region-in-transition, online-sna...

2018-07-06 12:18:07 4069 2

原创 Hbase架构 Hbase Region的拆分和合并

Hbase架构   Hbase Region的拆分和合并对命令不熟查看帮助文档help 'split'hbase(main):035:0> scan 'hbase:meta'ROW COLUMN+CELL ...

2018-07-06 12:17:53 2604 1

原创 通过ZooKeeper的api访问ZooKeeper集群

zookeeper集群的的搭建:点击打开链接创建Maven项目pom.xml   添加依赖:<dependency> <groupId>org.apache.zookeeper</groupId> <artifactId>zookeeper</artifactId> <version>3.4.9<...

2018-07-05 23:10:45 4211 2

原创 自定义函数(UDF) 将字符串转换成日期

                                     自定义函数(UDF)把字符串转换成日期创建类继承UDFimport java.text.ParseException;import java.text.SimpleDateFormat;import java.util.Date;import org.apache.hadoop.hive.ql.exec.Descri...

2018-07-02 21:45:18 1464

转载 centOS 7下无法启动网络(service network start)错误解决办法(应该是最全的了。。。)

点击打开链接

2018-07-02 17:14:01 364

原创 HIVE 视图 索引 桶表

视图-view(虚表) 降低查询的复杂度创建视图 view create view view1 as select c.id cid,c.name,c.age,o.id oid, o.ordernum,o.price from customers c left outer join orders o on c.id = o.id;对视图进行查询hive (hive1)> select * f...

2018-07-01 17:47:14 249

原创 HIVE 中 内连接 外连接 左外连接 右外连接 全外连接 联合操作

hive的join操作,只支持等值连接创建customers和orders表,一对多关系创建customers表create table customers(id int,name string,age int) row format delimited fields TERMINATED by '\t' lines TERMINATED by '\n' stored as textfil...

2018-07-01 14:33:39 20696

scala.rar学习笔记和心得

Scala 是一门多范式(multi-paradigm)的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。 Scala 运行在Java虚拟机上,并兼容现有的Java程序。 Scala 源代码被编译成Java字节码,所以它可以运行于JVM之上,并可以调用现有的Java类库。

2020-06-13

javase.rar

Java是一门编程语言,是用来编写软件的。QQ、迅雷、淘宝、京东等等这些常用软件都可以用Java来编写。ava的开发环境需要安装,包括JDK(Java Development Kit)和JRE(Java Runtime Envionment)

2020-06-07

Mysql详细学习笔记.rar

该资源比较适合学习Sql语句的人员,该资源比较详细,笔记做的比较好,适合大部分人使用,便于掌握学习,是个很好的学习资源,得到了很多人的认可

2020-06-06

dianyingshujuji.csv

该数据是关于电影的·一些数据,可以对该数据进行分析,数据比较完整,很适合做一些影评的分析,是非常好的数据集,希望能够帮助到大家。在数据这方面可以通过一些资源进行获取,大家也可以根据自己的情况,进行参考。

2020-04-23

scala.rar基础知识,笔记很好的详细

Scala学习资源Scala编程语言抓住了很多开发者的眼球。如果你粗略浏览Scala的网站,你会觉得Scala是一种纯粹的面向对象编程语言,而又无缝地结合了命令式编程和函数式编程风格。Christopher Diggins认为: 不太久之前编程语言还可以毫无疑意地归类成“命令式”或者“函数式”或者“面向对象”。Scala代表了一个新的语言品种,它抹平了这些人为划分的界限。

2020-02-28

CDH安装文档详细基础

CDH集群安装的详细步骤,带截图比较详细,适合初学者进行学习

2019-08-12

hadoop源码编译

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 需要进行hadoop源码的编译

2018-12-15

Mysql高级文档超详细

Mysql高级深入,文档超级详细,解释的详细 相信通过这次学习 你收获的肯定特别多

2018-12-14

flink详细教学

flink比较全面的教学视频 基础和理论实践相结合 比较适合初学者进行学习

2018-12-14

MySQL性能管理及架构设计

只列出部分章节详情请看里面的内容,第8章 数据库的分库分表 第6章 数据库索引优化

2018-12-14

比较全面数据仓库开发视频

数据仓库开发视频,比较全面,适合初学者进行学习,该套视频看过感觉挺好的掌握了很多自己以前缺少的知识

2018-12-14

spark深度解析

能够帮助学习spark的更加全面了解spark的底层原理,希望通过学习这个资料能够帮助大家快速的掌握和上手

2018-12-12

centos7快速上手Linux 玩转典型应用

此文档是关于centos7快速上手的相关操作文档,和一些服务器相关的搭建

2018-12-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除