艾默生莱斯-CSDN博客

原创最最无语的异常：java.lang.NoClassDefFoundError: org/apache/kafka/common/errors/InvalidConfigurationException

今天在使用sparkStreaming 连接kafka时，出现了一个令人很无语的报错：如下：2020-08-19 18:59:02,524 ERROR [org.apache.spark.executor.Executor] - Exception in task 0.0 in stage 0.0 (TID 0)java.lang.NoClassDefFoundError: org/apache/kafka/common/errors/InvalidConfigurationException at

2020-08-19 19:18:28 3037 1

原创 flume拦截器实现多channel传输

文章目录一、拦截器简介二、idea构建拦截器三、flume conf文件编写四、执行命令并查看结果一、拦截器简介拦截器主要用来实现日志的分类，修改或者删除不需要的日志信息，拦截器分为内置拦截器和自定义拦截器。下面我们主要介绍使用自定义拦截器来将信息分类传输。二、idea构建拦截器首先构建一个maven工程，在pom依赖包中添加如下依赖： <dependency> <groupId>org.apache.flume</groupId>

2020-08-17 20:15:41 432

原创 RDD常用转换算子和动作算子

文章目录一、转换算子1.map2. filter3.mapValues4. distinct、union、intersection5. reduceByKey、sortByKey、groupByKey6. flatMap一、转换算子1.map对RDD中的每个元素都执行一个指定的函数来产生一个新的RDD任何原RDD中的元素在新的RDD中都有且只有一个元素与之对应输入分区和输出分区一一对应//创建一个spark context对象val conf:SparkConf = new Spark

2020-08-06 15:26:41 2219

原创 shell脚本一键配置hadoop

文章目录一、环境配置** 脚本使用条件及脚本功能二、配置hadoop配置文件**脚本实现功能三、总结一、环境配置直接上脚本代码#!/bin/bash# 修改主机名和主机列echo "-------------开始修改主机名和主机列表--------------"a=`ifconfig ens33|awk -F " " 'NR==2{print $2}'`hostnamectl set-hostname znnb=`hostname`echo -e "$a \c" >> /etc

2020-07-25 15:21:51 990 1

原创 Region的拆分与合并

文章目录一、拆分与合并的目的拆分合并二、Region拆分1.自动拆分2.手动拆分(1).Linux命令行创建(2).在HBase命令行里创建(3).指定拆分文件(4).强制拆分三、Region合并1.Minor Compaction2.Major Compaction3.三种触发合并检查的情况4.合并操作一、拆分与合并的目的拆分当一个Region大到一定程度，或导致读取效率太低，所以会进行分裂HBase可以通过Region Split达到负载均衡Region的拆分分为自动拆分与手动拆分合并

2020-07-23 23:20:28 2139

原创 Phoenix操作HBase及二者的主要区别

文章目录一、jar包引入二、Phoenix启动并操作HBase1. 查看所有表2.建表3.插值4.查看表数据三、Phoenix和HBase的主要区别一、jar包引入将下面的jar包拷贝到Hbase的lib目录apache-phoenix-4.14.0-cdh5.14.2-bin.tar安装包路径：https://pan.baidu.com/s/10gV6dXEZFxXasZCvelQ-sQ提取码：ew0w下载完成后解压，然后进入到phoenix的bin目录找到需要拷贝的jar文件我们需要拷贝

2020-07-23 17:19:15 738

原创实例分析HBase与Hive的集成

文章目录一、HBase与Hive的对比1.Hive(1). 数据仓库(2).用于数据分析、清洗(3).基于HDFS、MapReduce2.HBase(1).数据库(2).用于存储结构化和非结构化的数据(3).基于HDFS(4).延迟较低，接入在线业务使用二、HBase与Hive集成使用1.实例分析一、HBase与Hive的对比1.Hive(1). 数据仓库 Hive的本质其实相当于将HDFS中已经存储的文件在Mysql中做一个双射关系，以便使用HQL查询管理。(2).用于数据分析、清洗 Hi

2020-07-23 16:18:19 174

原创 HBase架构、数据存储结构及工作原理分析

文章目录一、HBase介绍二、HBase架构1.主架构(1).Client(2).Zookeeper(3).HMaster()4.HRegionServer(5).HDFS2.其他组成部分(1).Write-Ahead Logs(2).HRegion(3).Store(4).MemStore(5).HFile三、HBase数据存储结构1.RowKey一、HBase介绍定义：HBase是一个面向列存储的数据库，它是一个分布式的hash map，并能够利用HDFS的可靠性来做存储功能。特点数据访问速

2020-07-22 23:16:34 947

原创 HBase常用命令及相关权限命令

文章目录一、基本命令二、操作命令一、基本命令查看版本号——version查看状态——status查看当前用户——whoami使用帮助——help二、操作命令创建表——create ‘user’,‘baseinfo’,‘privateinfo’——user是表名，baseinfo和privateinfo是两个列簇(列族)查看所有表——list查看表的具体信息——desc ‘user’判断表是否存在——exists ‘user’向表中插入数据put ‘user’,‘001’,‘ba

2020-07-21 00:19:03 809

原创建、判、插、读、删五步走——Java API 操作HBase

文章目录一、准备工作二、程序编写1.建表2.判断表是否存在3.向表中插入数据4.查看数据5.删除表三、总结一、准备工作HBase 除了可以使用HBase shell来操作外，还可以使用Java API的方式来管理名字空间。使用IDEA 创建一个Maven工程添加依赖包，pom文件如下<dependency> <groupId>junit</groupId> <artifactId>junit</artifactId&

2020-07-20 19:20:38 102

原创 Hive基本概念

文章目录一、什么是hive?二、Hive的优缺点三、Hive架构四、Hive和数据库比较一、什么是hive?Hive是由Facebook开源，用来解决海量结构化日志数据统计Hive是基于数据仓库的解决方案，将一个结构化的数据映射成一张表，并且提供类SQL的查询语言本质：将HQL转化为MapReduce程序：（1）Hive处理的数据存储在HDFS上（2）Hive分析引擎默认为MapReduce （3）执行程序运行在Yarn上二、Hive的优缺点优点：操作接口采用了类SQL语法，减少了学习

2020-07-19 22:51:51 105

原创 zepplin环境搭建——好用到手软

文章目录一、下载安装包并解压二、修改zepplin配置文件1、一、下载安装包并解压安装包路径：https://pan.baidu.com/s/1d5g2aAFmUJLqUTV10e4BWA提取码：4ich下载完成后，将安装包拖到自己Mobarxterm中soft目录(我这里使用的是Mobarxterm，soft目录是自己的hadoop、hive的安装目录)；上传完成后，将安装包解压；解压完成后，修改zepplin的目录名以便使用：[root@znn ~]# cd /opt/soft/[roo

2020-07-14 12:21:16 474

原创 Hive常用函数及实例演示

文章目录一、数学函数二、转化函数三、日期函数四、条件函数五、字符串函数一、数学函数1.round(double a,int b) 返回a保留b位小数位的值，根据四舍五入原则select round(4.356),round(4.356,2),round(4.354,2)+------+-------+-------+--+| _c0 | _c1 | _c2 |+------+-------+-------+--+| 4.0 | 4.36 | 4.35 |+------+--

2020-07-14 01:41:29 220

原创浅析Mapreduce工作原理

MapReduce各阶段工作原理图：下面讲解MapReduce的工作过程及原理：1.split阶段对于传入进来的大文件，采用TextInputFormat文件输入方式，然后对其进行物理分片，按照128M一个分片来分成若干map tasks。如果传入的是一个一个小文件，可以采用CombinerInputFormat方式传入文件，将其聚合成一个大文件。2.一行一行读使用的是TextInputFormat类中的getRecordReader方法来获取行信息，源码如下：public RecordRea

2020-07-05 13:53:50 291

原创启动hadoop时异常：connect to host hadoop002 port 22: Connection refused

问题描述今天在搭建hadoop伪分布式集群时，启动hadoop，报如下异常情况，hadoop002（也就我设置的Secondary namenode）拒绝连接，启动Secondary namenode失败。[root@hadoop1 ~]# start-all.shThis script is Deprecated. Instead use start-dfs.sh and start-yarn.sh20/07/03 01:09:10 WARN util.NativeCodeLoader: Unab

2020-07-03 01:39:09 3220

原创运用MapReduce实现wordCount

一、idea环境配置要使用MapReduce来进行单词计数，需要导入需要的jar包，所以我们这里使用Maven来建工程，可以通过配置文件参数来自动引入所需要的jar包，下面是配置文件poem.xml的参数：<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instanc

2020-07-02 19:52:53 1998

原创使用shell脚本一键式解压压缩文件

话不多说，先上代码：#!/bin/bashcd /opt/software ----文件的目录位置count=`ls -l | grep '^-' | wc -l` ----保存当前目录下的文件个数，这里使用管道符来进行计算if [ $count -ne 0 ]; ----文件个数不等于0开始进入条件then for file in `ls` ----遍历所有文件 do fileName=$file ----将文件名进行保存，这里是方便后面截取文件

2020-06-30 01:13:54 4282

原创最最最详细的Hadoop+HBase+Zookeeper+Hive完全分布式环境搭建教程

文章目录一、准备工作二、hadoop搭建1.配置主机名和主机列表2.配置免密登录3.配置环境变量4.配置hadoop配置文件三、HBase配置1.配置hbase-site.xml文件2.配置hbase-env.sh文件3.配置log4j.properties文件4.配置regionservers四、集群搭建1.修改hdfs-site.xml文件2.修改slaves文件3.复制到另外两台机器上五、Zookeeper搭建1.配置zoo.cfg文件2.创建myid文件并启动zookeeper3.启动hbase4.

2020-06-29 02:27:10 3039

原创启动hadoop无DataNode进程服务的简单粗暴解决办法

问题：我们经常会在第二次启动hadoop时出现DataNode服务没有成功启动简单粗暴的解决方案：1.首先将所有服务全关掉：stop-all.sh2.找到一开始建的tmp临时目录，直接rm -rf掉3.在hadoop-2.6.0-* 目录下找到logs文件，直接rm -rf掉4.再次执行之前的操作，格式化hdfs：hadoop namenode -format5.重新再启动所有服务，此时再jps显示所有进程时，可以出现DateNode成功启动...

2020-06-26 00:48:01 603

原创 Linux环境下配置和安装hadoop及hadoop集群搭建(VMware)

文章目录一、安装准备二、hadoop的配置1.首先配置hadoop-env.sh2.配置core-site.xml3.配置hdfs-site.xml4.配置mapred-site.xml5.配置yarn-site.xml6.配置slaves7.配置hadoop环境变量三、格式化HDFS四、启动hadoop五、集群搭建1.克隆虚拟机2.配置免密登录3.修改主机器的配置文件4.修改备用机器的配置文件5.启动hadoop一、安装准备在linux环境下安装hadoop需要准备的资料如下：这里主要需要准备的就

2020-06-26 00:35:50 589

qq_38497133的博客

原创最最无语的异常：java.lang.NoClassDefFoundError: org/apache/kafka/common/errors/InvalidConfigurationException

原创 flume拦截器实现多channel传输

原创 RDD常用转换算子和动作算子

原创 shell脚本一键配置hadoop

原创 Region的拆分与合并

原创 Phoenix操作HBase及二者的主要区别

原创实例分析HBase与Hive的集成

原创 HBase架构、数据存储结构及工作原理分析

原创 HBase常用命令及相关权限命令

原创建、判、插、读、删五步走——Java API 操作HBase

原创 Hive基本概念

原创 zepplin环境搭建——好用到手软

原创 Hive常用函数及实例演示

原创浅析Mapreduce工作原理

原创启动hadoop时异常：connect to host hadoop002 port 22: Connection refused

原创运用MapReduce实现wordCount

原创使用shell脚本一键式解压压缩文件

原创最最最详细的Hadoop+HBase+Zookeeper+Hive完全分布式环境搭建教程

原创启动hadoop无DataNode进程服务的简单粗暴解决办法

原创 Linux环境下配置和安装hadoop及hadoop集群搭建(VMware)

原创 Elasticsearch实现基础的增删改查(Kibana模式)

原创 shell常用脚本(一)

原创 ELK集群搭建(Linux系统:centos7)

原创 Linux系统的ELK安装及配置

原创 mybatis实现简易图书管理系统

原创 Linux采用SSH协议远程连接及系统软件安装(jdk、tomcat、Mysql)

原创 Linux常用命令(增、删、改、查、赋权、解压)

原创 MyBatis连接数据库实现增删改查

原创 Linux环境安装Mysql

空空如也

空空如也