自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 HDFS java.io.IOException: Cannot obtain block length for LocatedBlock

原因:文件异常关闭,导致文件无法被读取,一直没有释放租约。 由于文件目录下有多个文件,使用命令检查 hdfs fsck /flume/logs/tyc_data/2019-09-25 正常的文件夹如下: 由于文件夹中有多个文件,使用命令查找具体哪个文件出错 hadoop fsck /flume/logs/tyc_data/2019-09-25 -openforwrite | egrep -v...

2019-09-27 11:07:09 554

原创 hbase自定义协处理器实现

hbase自定义协处理器实现 首先编写代码,集成BaseRegionObserver,在代码中添加输出信息到/opt/apps/hbase_logs/hbase.log,如果协处理器生效,就会输出信息到hbase.log。 import org.apache.hadoop.hbase.CoprocessorEnvironment; import org.apache.hadoop.hbase...

2019-08-03 13:09:41 563

原创 spark自定义外部数据源

对于spark外部数据源来说,要先了解这几个类 BaseRelation:定义数据的schema信息,把我们的数据转成RDD[Row] RelationProvider:是一个relation的提供者,创建BaseRelation TableScan:读取数据并构建行,拿出所有的数据 PrunedScan:列裁剪的 PrunedFilteredScan:列裁剪➕过滤 InsertableRelat...

2019-08-03 13:06:27 2601

原创 JVM G1

http://youzhixueyuan.com/detailed-explanation-of-jvm-g1.html JVM垃圾收集器发展历程 第一阶段,Serial(串行)收集器 在jdk1.3.1之前,java虚拟机仅仅能使用Serial收集器。 Serial收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅是说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是...

2019-07-24 11:30:56 302

原创 spark自定义累加器

在spark2.0后,官方提供了一个新的抽象类AccumulaterV2来提供更加友好的自定义类型累加器的实现方式。 abstract class AccumulatorV2[IN, OUT] extends Serializable 实现自定义累加器需要继承AccumulatorV2并重写下面的方法。 class MyAccumulator extends AccumulatorV2...

2019-07-19 16:35:42 242

原创 java引用类型

java中有四种引用类型,或者说是引用方式。 强引用(String Reference):即时进行了多次的GC回收,即使JVM的内存真的已经不够用了,即使JVM最终不得已抛出了OOM错误,那么该引用继续抢占; 软引用(Soft Reference):当我们内存空间不足时,可以回收此内存空间。如果内存空间充足,则不回收。可以用其完成一些缓存的处理操作。 弱引用(Weak Reference):...

2019-07-16 10:44:41 72

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除