自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

天龙八部

当你回首往事,留下的都是记忆,而不是悔恨。

  • 博客(49)
  • 收藏
  • 关注

原创 hdfs学习笔记整理

目录hdfs文件系统 架构图各个组件介绍namenode:集群主节点,管理集群各种数据,维护元数据secondaryNameNode:高可用模式没有journalNode高可用才有DataNode从节点常用文件命令访问hdfs文件的方式1.Api访问文件2.文件系统方式访问数据hdfs文件系统 架构图元数据和...

2019-08-22 17:14:24 297

原创 redis笔记

1.redis数据类型String:字符串 hash:散列 list:集合 Set:集合 Sorted Set: 有序集合redis是单线程运行,所以是线程安全的redis持久化方案快照RDB:在指定的时间间隔内生成数据集的时间点快照(point-in-time snapshot),默认Redis 将数据库快照保存在名字为 dump.rdb的二进制文件 快照是一个压缩的二进...

2019-08-20 23:38:22 85

原创 spark并行度和mapreduce并行度对比

spark和mapreduce的区别mapreduce是多进程模型,即里面的一个task对应一个进程 优点:进程便于更细粒度的控制每个任务的占用资源,但是启动慢 spark是多线程模型,任务以分区为单位,一个分区对应一个task 任务以线程的方式运行,启动快 模型对比 mapreduce 主节点resourcemanager负责分配资源调度 从节点no...

2019-08-20 15:44:06 920

原创 常用垃圾收集器笔记

垃圾收集器多种垃圾收集器,包括:串行垃圾收集器、并行垃圾收集器、CMS(并发)垃圾收集器、G1垃圾收集器串行垃圾收集器serial使用算法:年轻代使用 复制算法, 老年代使用标记整理算法特点: 单线程进行垃圾回收,垃圾回收时,只有一个线程在工作 停顿延迟高 缺点 停顿延迟高:执行回收时所有的Java线程都停止工作 参数设定 -XX:+UseSerialGC 年轻...

2019-08-20 01:24:35 149

原创 JVM垃圾回收和内存划分笔记

内存划分为一下4部分方法区( 又称永久代,别名非堆) 主要存储类信息、常量、静态变量,字段描述,方法描述 堆内存 基本上new出来的对象都存在这里以及类变量,也是GC的主要区域 栈内存 方法执行时创建虚拟机栈,存储局部变量,方法出入口 程序计数器 每一线程都有一个独立的计数器,是线程私有的内存空间(比较小)存储的正在执行的字节码地址,线程的恢复,跳转,循环等都依赖它实现,如果是nati...

2019-08-20 00:36:58 124

原创 sparkStream重启后获取checkpoint数据的使用问题

学习checkpoint使用是重启时总是获取不到重启之前的值,后来才发现用法不对最开始都是直接创建对象用new 的方式创建对象,代码如下def main(args: Array[String]): Unit = {val conf: SparkConf = new SparkConf().setMaster("local[4]").setAppName("SparkStreamingS...

2019-08-19 02:01:39 824

原创 MapReduce分布式计算框架学习

MapReduce 分布式计算核心思想:分而治之 map 把复杂的任务分成简单的任务,相互之间没有依赖,可以并行计算 reduce 对map阶段的结果机型汇总框架结构图MrAppMaster:负责程序的过程调度以及状态协调 maptask:负责map阶段整个数据处理流程 ReduceTask:负责reduce过程处理MapReduce的变成八个步骤1.读取文件...

2019-08-18 11:34:26 323

原创 hadoop学习hdfs笔记

1.hadoop架构模型hdfs集群 访问地址http://ip:50070/namenode:集群当中的主要节点,主要用于管理集群当中的各种数据; 管理元数据,存在内存中;管理客户端对文件读写请求,决定文件写在哪里,副本存储什么位置; 元数据信息保存在edits,FSImage secondaryNameNode:对hadoop当中的原属句信息辅助管理元数据的,定期...

2019-08-14 23:48:27 179

原创 学习 sparksql 遇到的异常问题

问题描述:启动spark和zookeeper,在客户端以spark-shell --master local[2] 方式启动1. val lineRDD= sc.textFile("/person.txt").map(_.split(" ")) 读取hdfs上的文件将RDD转换成DataFrame 执行rdd.toDF方法报错执行lineRDD.collect方法仍然报错才发现had...

2019-07-16 15:01:43 519

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除