自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 There are 0 datanode(s) running and no node(s) are excluded in this operation.

hadoop集群报错:could only be written to 0 of the 1 minReplication nodes. There are 0 datanode(s) running and no node(s) are excluded in this operation.最近在搭建hadoop集群,在上传文件至hdfs时,出现以上错误,找了多数文章,都没有解决好,最后发现是权限问题。在创建name文件和data文件时(hdfs-site.xml配置文件下dfs.namenode.

2021-03-18 13:50:08 496

原创 Spark Local模式环境搭建和使用

Spark Local模式环境搭建和使用Spark是一个开源的可应用于大规模数据处理的分布式计算框架,该框架可以独立安装使用,也可以和Hadoop一起安装使用。为了让Spark可以使用HDFS存取数据,本次采取和Hadoop一起安装的方式使用。Spark的部署模式主要有4种:Local(单机模式)、Standalone模式(使用Spark自带的简单集群管理器)、YARN模式(使用YARN作为集群管理器)和Mesos模式(使用Mesos作为管理器)。本实验介绍Local模式(单机模式)+Hadoop伪分布

2021-03-03 21:35:55 970 1

原创 Spark安装配置和基础编程

Spark安装配置和基础编程重要知识点:Spark是一个开源的可应用于大规模数据处理的分布式计算框架,该框架可以独立安装使用,也可以和Hadoop一起安装使用。为了让Spark可以使用HDFS存取数据,本实验采取和Hadoop一起安装的方式使用。Spark的部署模式主要有4种:Local(单机模式)、Standalone模式(使用Spark自带的简单集群管理器)、YARN模式(使用YARN作为集群管理器)和Mesos模式(使用Mesos作为管理器)。本实验介绍Local模式(单机模式)的Spark安装

2020-12-08 22:16:45 1928 2

原创 Kafka分布式发布-订阅消息系统编程实践

Kafka分布式发布-订阅消息系统编程实践重要知识点:Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作数据流。Kafka的目的是通过Hadoop和Spark等的并行加载机制来统一线上和离线的消息处理。实验内容与步骤:一、Kafka的安装与配置1.Kafka的下载安装在Ubuntu下打开官网:http://kafka.apache.org/downloads进行下载,建议下载稳定版本 kafka_2.11-2.1.1.tgz (亲自测试)下载完成后

2020-12-01 20:45:26 374

原创 Zookeeper分布式协调服务安装与使用

Zookeeper分布式协调服务安装与使用重要知识点:Zookeeper是一个分布式协调服务的开源框架,它是由Google的Chubby开源实现。Zookeeper主要用来解决分布式集群中应用系统的一致性问题和单点故障问题,例如如何避免同时操作同一数据造成脏读的一致性问题等。Zookeeper具有全局数据一致性、可靠性、顺序性、原子性以及实时性,可以说Zookeeper的其他特性都是为满足Zookeeper全局数据一致性这一特性。Zookeeper集群是一个主从集群(一般为奇数2n+1),它一般是由

2020-11-25 00:26:35 397

原创 Sqoop数据迁移

Sqoop数据迁移重要知识点:Sqoop是一款开源工具,主要用于在Hadoop与传统关系数据库之间进行数据的传递,可以将一个关系数据库,比如mysql、oracle等中的数据导入到Hadoop的HDFS、HBase、Hive中,也可以将Hadoop的数据导入到关系数据库中。实验内容与步骤:一、Sqoop的安装与配置1.Sqoop的下载在Ubuntu下打开官网:http://sqoop.apache.org/ 进行下载,建议下载稳定版本 sqoop-1.4.7.bin__hadoop-2.6.0.

2020-11-20 12:24:54 483

原创 Flume日志采集系统安装与使用

Flume日志采集系统安装与使用三、实验实现过程重要知识点:1.Flume是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接收方的能力。实验内容与步骤:一、Flume的安装与配置1.Flume的下载安装在Ubuntu下打开官网:http://flume.apache.org/download.html进行下载, 建议下载稳定版本apache

2020-11-10 19:15:20 1116

原创 Hadoop的数据仓库工具Hive安装与编程实践

Hadoop的数据仓库工具Hive安装与编程实践重要知识点:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以

2020-11-04 12:51:32 1128

原创 HBase环境搭建与编程实践

HBase环境搭建与编程实践重要知识点:1.HBase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个结构化数据的分布式存储系统》。HBase以表的形式存储数据,表有行和列组成,列划分为若干个列族/列簇(column family)。HBase官方网站(http://hbase.apache.org/)。2.HBase的运行有三种模式:单机模式、伪分布式模式、分布式模式。单机模式:在一台计算机上安装和使用HBase,不涉及数据的分布式存储;伪分布式模式:在一台

2020-10-28 10:34:55 468

原创 NoSql数据库mongoDB安装与编程实践

NoSql数据库mongoDB安装与编程实践重要知识点:MongoDB 是一个是一个基于分布式文件存储的数据库,介于关系数据库和非关系数据库之间,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。MongoDB有2种安装方式:离线安装和在线安装。在线安装一般

2020-10-21 12:28:52 428 1

原创 MapReduce经典案例实战

MapReduce经典案例实战实验实现过程重要知识点:MapReduce是一种分布式并行编程模型,是Hadoop核心子项目之一,如果已经安装了Hadoop,就不需要另外安装MapReduce。主要的理论知识点:(1)倒排索引倒排索引是文档检索系统中最常用的数据结构,被广泛应用于全文搜索引擎。倒排索引主要用来存储某个单词(或词组)在一组文档中的存储位置的映射,提供了可以根据内容来查找文档的方式,而不是根据文档来确定内容,因此称为倒排索引(Inverted Index)。带有倒排索引的文件我们称为

2020-10-14 14:28:49 16466 2

原创 MapReduce编程实践

MapReduce编程实践重要知识点:MapReduce是一种分布式并行编程模型,是Hadoop核心子项目之一,如果已经安装了Hadoop,就不需要另外安装MapReduce。主要的理论知识点包括:MapReduce概述、MapReduce的工作流程,WordCount实例分析,MapReduce的具体应用。掌握MapReduce的核心思想、编程模型、工作原理和实例分析。MapReduce的程序可以用Eclipse编译运行或使用命令行编译打包运行,本实验使用Eclipse编译运行MapReduc

2020-10-07 12:05:27 5234 5

原创 分布式文件系统HDFS Shell命令和API编程

分布式文件系统HDFS Shell命令和API编程Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)是Hadoop核心组件之一,如果已经安装了Hadoop,其中就已经包含了HDFS组件,不需要另外安装。利用Shell命令与HDFS进行交互Hadoop支持很多Shell命令,其中fs是HDFS最常用的命令,利用fs可以查看HDFS文件系统的目录结构、上传和下载数据、创建文件等。注意:命令是以”./bin/hadoop dfs”开头的Shell命令方

2020-09-30 11:04:24 1079

原创 Hadoop环境配置与测试

Hadoop环境配置与测试前面的实验我们做好了Linux环境和Hadoop环境的准备与配置工作,因此这一实验我们在上一实验的基础上进行Hadoop环境的配置和测试。Hadoop环境搭建前的Linux环境安装与配置https://blog.csdn.net/weixin_43640161/article/details/108614907Linux下JDK软件的安装与配置https://blog.csdn.net/weixin_43640161/article/details/108619802掌

2020-09-23 12:27:29 3490 6

原创 大数据实验环境准备与配置(第四部分完结)

大数据实验环境准备与配置(第四部分完结)第四部分:Hadoop的下载与解压(1)Hadoop安装包下载下载地址:http://hadoop.apache.org/releases.html(在Ubuntu系统里面的浏览器打开)可以自己选择版本,最新版是hadoop-3.3.0.tar.gz下载完成后,可以在"Downloads"里面查看(2)解压安装包先新建文件夹bigdata,解压到该目录下。终端命令:sudo mkdir /bigdata解压安装包:终端命令:sudo ta

2020-09-20 20:49:28 1002 1

原创 大数据实验环境准备与配置(3/4)

大数据实验环境准备与配置(2/4)第三部分:Linux下Eclipse软件的安装与配置(1)在线下载并拷贝到当前用户Downloads目录下面下载地址:https://www.eclipse.org/downloads/点击 “Download Packages”选择对应的操作系统下载。这里注意!选择其他镜像选择国内的下载点,才能达到全速下载。拷贝到Downloads目录下(直接拖拽进去)(2) 解压eclipse到/opt目录下鼠标右键点击空白处,选择打开终端”Open in

2020-09-20 15:19:23 1532

原创 大数据实验环境准备与配置(2/4)

大数据实验环境准备与配置(2/4)第二部分:JDK软件的安装与配置(1)下载JDK软件有两种方法:在线安装以及拖拽安装包进行手动安装。在线安装比较简单,这里就只讲第二种:在Windows上下载jdk安装包,然后拖拽到Ubuntu系统里面进行安装以下是官方网站https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html点击后会提示登录后下载,输入账户后,会自动下载。(没有账户的也可以用邮箱注册,流程很简

2020-09-16 12:49:53 939

原创 大数据实验环境准备与配置(1/4)

大数据实验环境准备与配置(1/4)第一部分:Hadoop环境搭建前的Linux环境安装与配置(1) 搜索 “Ubuntu”,选择官方下载。或者打开网站:https://ubuntu.com/download/desktop(2) 点击绿色的 Download按钮。(3) 这个官方网站是全速下载,这里391KB/s是因为我网络全速就这样/(ㄒoㄒ)/~~(4) iso文件下载完成后,在已经准备好的虚拟机软件VMware里面进行Ubuntu系统的安装选择 “创建新的虚拟机”(5) 选择

2020-09-16 11:14:01 2041

原创 微信小程序开发环境安装以及开发者账号注册

微信小程序开发环境安装以及开发者账号注册微信小程序,小程序的一种,英文名Wechat Mini Program,是一种不需要下载安装即可使用的应用,它实现了应用“触手可及”的梦想,用户扫一扫或搜一下即可打开应用。许多小伙伴肯定都想开发一款属于自己的小程序,快来跟我一起学吧。安装开发环境安装小程序开发环境,是开发小程序的第一步:登录微信小程序官方网站:https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html点击对

2020-09-15 21:25:19 711

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除