自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Bingmous的博客

新博客已搬家至https://www.cnblogs.com/bingmous

  • 博客(18)
  • 收藏
  • 关注

原创 HBase学习笔记

第1章

2020-07-29 13:53:30 186

原创 Kafka学习笔记

第1章 Kafka概述定义:分布式的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域。 消息队列好处: 解耦,允许独立的扩展或修改数据生产者消费者,只需要确保同样的接口约束。 可恢复性,一部分组件失效,不会影响整个系统。消息队列降低进程间的耦合度,即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后处理。 缓冲,有助于控制和优化数据流经过系统的速度,解决生产消息和处理消息速度不一致的情况。 灵活性、峰值处理能力, 异步通信,允许把消息放入队列,并不立即处理,需要

2020-07-25 23:50:53 170

原创 Flume学习笔记

第1章 Flume概述Flume 是Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构,灵活简单 基础架构Agent是一个 JVM 进程,它以 事件 的形式将数据从源头送至目的。主要有三部分组成:Source,Channel,Sink Source负责收集数据到flume,可以处理各种数据类型:TAILDIR、avro、exec、spooldir、netcate TAILDIR:可以同时监控多个动态变化的文件,可以断点续传,不

2020-07-23 23:04:29 327

原创 Hive学习笔记

第1章 Hive基本概念Hive是基于Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL 查询功能。 Hive架构原理:解析器、编译器、优化器、执行器 源数据存在HDFS上,metadata存在数据库上第2章 Hive安装Hive安装解压,修改名为hive 修改conf目录下的hive-env.sh,添加HADOOP_HOME,HIVE_CONF_DIR: export HADOOP_HOME=/opt/module/hadoop 2.7.2 exp

2020-07-21 15:29:58 183

原创 Hadoop - HA学习笔记

Hadoop HA概述工作要点通过双NameNode消除单点故障 元数据管理方式需要改变:内存中各自保存一份元数据;Edits 日志只有 Active 状态的NameNode节点可以做写操作;两个 NameNode都可以读取 Edits;共享的Edits放在一个共享存储中管理(qjournal 和 NFS 两个主流实现); 需要一个状态管理功能模块:实现了一个zkfailover ,常驻在每一个 NameNode 所在的节点,每一个 zkfailover 负责监 控自己所在NameNode节

2020-07-17 19:49:09 165

原创 Zookeeper学习笔记

第1章 ZooKeeper入门Zookeeper 是一个开源的分布式的,为分布式应用提供协调服务的Apache 项目。ZooKeeper=文件系统+通知机制第2章 ZooKeeper安装安装jdk 解压ZooKeeper 配置修改: 修改/opt/module/zookeeper-3.4.10/conf 这个路径下的zoo_sample.cfg 修改为zoo.cfg 打开zoo.cfg 文件,修改dataDir 路径dataDir=/opt/module/zookeeper-3.4.10

2020-07-16 10:46:56 142

原创 常用Windows命令

Win7截屏工具:snippingtool 画板:mspaint 查看服务:services.msc 查看引导启动服务:msconfig 查看ip:cmd下,ipconfig

2020-07-15 14:21:19 149

原创 vmware启动后虚拟机无法联网

搜索services.msc打开服务确认VMware NAT service和VMware DHCP service服务处于启动状态;开启自动启动,下次就会自动联网了

2020-07-15 14:20:50 211

原创 Hadoop - MapReduce学习笔记(详细)

第1章 MapReduce概述是一个分布式运算程序的编程框架 mapreduce进程,一个完整的mapreduce有三类实例 MrAppMaster,负责整个程序的过程调度及状态协调 MapTask,负责map阶段的数据处理 ReduceTask,负责reduce阶段的数据处理 编程规范 mapper阶段 reducer阶段 driver阶段 第2章 hadoo...

2020-07-15 10:00:09 350

原创 maven配置本地仓库和远程仓库

配置本地仓库maven安装目录:E:\maven\apache-maven-3.5.4\conf下修改settings.xml<localRepository>E:\maven\MavenRepository</localRepository>配置远程仓库在<profiles>添加如下远程仓库 <profile> <id>dev</id> <!-

2020-07-07 16:38:55 431

原创 Hadoop - HDFS学习笔记(详细)

第一章 HDFS概述hdfs背景意义 hdfs是一个分布式文件系统 使用场景:适合一次写入,多次读出的场景,且不支持文件的修改。 优缺点 高容错性,适合处理大数据(数据PB级别,百万规模文件),可部署在廉价机器上 不适合低时延数据访问,无法高效存储大量小文件,不支持并发写入、随机修改(仅追加) hdfs组成架构 namenode,管理hdfs命名空间,配置副本策略,管...

2020-07-07 10:58:10 427

原创 hdfs刷新节点失败,未显示Refresh nodes successful

使用命令:hdfs dfsadmin -refreshNodes没有显示Refresh nodes successful,而是:refreshNodes: /opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude原因:hdfs-site.xml中dfs.hosts.exclude配置路径有换行错误# 错误!<property><name>dfs.hosts.exclude</name><value

2020-07-06 23:19:39 690

原创 hadoop 无法访问50070

windowshosts文件:C:\Windows\System32\drivers\etc centos防火墙 hadoop core-site.xml配置文件中的namenode地址 (yarn-site.xml RM地址)

2020-07-06 12:07:56 231

原创 centos虚拟机开机icmp_seq=1 Destination Host Unreachable

今天打开虚拟机发现无法远程,进入虚拟机后无法ping通VMnet8,发现VMnet8的属性都变成自动的了,设置后依然不通,移除所有配置后重新添加网络后解决解决办法:计算机 - 系统属性 - 设备管理器 - 网络适配器:右键卸载VMnet1和VMnet8打开虚拟机 - 编辑 - 虚拟网络编辑器 - 移除所有网络:重新添加网络和配置...

2020-07-06 11:10:52 1728

原创 idea中maven配置 Unable to import maven project: See logs for details

Help -> show log in Explorer1) No implementation for org.apache.maven.model.path.PathTranslator was bound. while locating org.apache.maven.model.path.PathTranslator for field at org.apache.maven.model.interpolation.AbstractStringBasedModelInter

2020-07-04 20:21:57 351

原创 Hadoop - 入门学习笔记(详细)

Hadoop 运行环境搭建(开发重点)1 虚拟机环境准备:vmware,centos7 创建虚拟机,安装centos7 虚拟机克隆

2020-07-04 13:01:07 491

原创 Hadoop2.7.2源码编译过程

准备工作CentOS可以联网,验证:ping www.baidu.com 是畅通的 jar 包准备(hadoop 源码、JDK8、maven、ant 、protobuf) (1)hadoop-2.7.2-src.tar.gz (2)jdk-8u144-linux-x64.tar.gz (3)apache-ant-1.9.9-bin.tar.gz(build 工具,打包用的) (4)apache-maven-3.0.5-bin.tar.gz (5)protobuf-2.5.0.tar.gz(序

2020-07-04 10:39:46 294

原创 使用lrzsz在windows、Linux之间互传文件

使用lrzsz进行文件互传:xshell远程linux 安装工具:yum install -y lrzsz,检查是否安装成功:rpm -qa |grep lrzsz 上传文件:rz,-y覆盖,就会打开本地选择文件对话框,选择文件,确定就可以上传到当前所在目录。 下载文件:sz file,弹出选择本地保存文件对话框。 Alt + P打开xshell的属性,打开【文件传输】这里可以调整传输的一些属性。...

2020-07-02 10:32:00 256

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除