自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 字节码层面理解--java中的finally是如何执行的

finally一直是java笔试中出现概率较高的知识点,我之前在面试的时候碰到也是很迷糊,今天就通过字节码来看finally最后究竟是怎样执行的,只要明白了原理,面试自然迎刃而解。阅读本文需要耐心,就算不懂字节码,多看看也就明白了,等哪天有空写一篇字节码入门的教程。废话不多说,进入正题。 1.t...

2019-12-24 02:00:37

阅读数 221

评论数 0

原创 字节码层面理解java中i++和++i的区别

还是让我们从一道面试题说起吧,代码如下,你知道方法执行最后会输出什么吗? public static void main(String[] args) { int i = 0; for (int j = 0; j < 50; j++) { i = i++;...

2019-12-22 01:39:49

阅读数 4281

评论数 32

原创 Java子类和父类的初始化执行顺序

有个朋友在CSDN评论区问我,java子类和父类初始化时各个代码块的执行顺序,我本来写好了一大段回复,点击发表回复,结果没有回复成功,我写的评论也不见了。。。csdn的评论区编辑体验本来就不好,然后还有这种回复失败的问题,这体验真是一言难尽,干脆再写一篇文章,从字节码层面来看这个顺序问题,希望可以...

2019-12-22 00:01:42

阅读数 2554

评论数 1

原创 从京东面试题看java类和对象的初始化

京东的一道java面试题,类A和类B的代码如下,问题:A a = new B(); 输出结果及正确的顺序? //A.java public class A { static { System.out.println("A init"); } ...

2019-12-21 20:41:04

阅读数 969

评论数 3

原创 字节码层面理解枚举类Enum在switch中的使用

1.本文从字节码层面来探究,switch的case变量值为java枚举Enum时,编译器究竟做了什么工作。 2.源码如下 枚举类Color public enum Color { RED,BLUE,YELLOW } switch中使用Color public class My...

2019-12-16 12:10:16

阅读数 219

评论数 0

原创 字节码层面理解Switch

1. 源码如下,test(int)方法使用switch语法,根据参数a的值返回不同字符串。 public class MySwitchTest { public String test(int a){ switch (a){ case 1: ...

2019-12-16 10:43:48

阅读数 206

评论数 0

原创 字节码层面理解java枚举Enum

1.自定义一个枚举类型Color.java public enum Color { RED,BLUE,YELLOW } 2.javac编译Color.java,生成Color.class。javac的时候记得添加-g选项才会生成局部变量表。 javac -g Color.java...

2019-12-13 22:29:24

阅读数 229

评论数 0

原创 Hadoop常用参数、命令笔记

查看压缩文件、普通文件 hadoop fs -text filename hadoop fs -text /user/vsearch/offline/bangxi/il/part-r-02998.snappy | head hadoop fs –cat filename //只能查看未压缩文...

2019-09-03 00:36:09

阅读数 138

评论数 0

原创 HBase常用参数、命令笔记

设置读HBase Mapper多线程数量 hbase.mapreduce.multithreadedmapper.threads hbase scanner 打印日志 hbase.client.log.scanner.activity //是否打印日志 hbase.mapreduce....

2019-09-03 00:35:27

阅读数 135

评论数 0

原创 HADOOP添加第三方jar依赖

每次运行hadoop jar命令时,会重新设置HADOOP_CLASS这个环境变量,并将这个变量的值赋给CLASSPATH,所以,只能通过设置HADOOP_CLASS这个环境变量来添加第三方的依赖,而设置CLASSPATH并不会生效。 在MR任务在提交阶段和task运行阶段,主要会遇见两类依赖问...

2019-09-02 17:22:06

阅读数 233

评论数 0

原创 决策树算法,如何快速判断美女会不会嫁给你

学习决策树必先了解信息熵 上一篇文章讲过,信息熵就是随机事件的不确定性。 公式: 不太清楚的,可以回头再去看一遍,https://blog.csdn.net/jiandabang/article/details/98690182,学习决策树之前至少需要了解信息熵是什么。 通过例子学习决策树...

2019-08-10 23:17:01

阅读数 148

评论数 0

原创 信息量、信息熵、条件熵、信息增益

信息量 有时候,当你知道某件事情的时候,你可能会说 “这有什么奇怪的啊”,比如,有同事告诉你“明天太阳从东边升起”,这就是说这件事情的信息量比较少。 又比如,当你知道明天彩票号码时,你就可能会说 “这个事是真的吗,太不可思议了”,就是说这件事情信息量比较大。 从上面的事情就是对一件事情携带信...

2019-08-07 20:26:38

阅读数 172

评论数 0

原创 机器学习:朴素贝叶斯分类

贝叶斯公式 先看条件概率,就是指事件A在事件B发生条件下发生的概率: 同理 可以推出 可以推出 ,该公式就是贝叶斯公式。 如何让计算机程序对水果分类 1.特征处理(准备数据) 生活中人们根据水果的形状、颜色、大小、表面纹路等特征很容易就可以对水果进行正确分类。但是让计算机来做这件事情...

2019-07-31 12:51:23

阅读数 276

评论数 0

原创 Bulkload找不到分区文件 IllegalArgumentException: Can't read partitions file

问题 使用bulkload方式导入数据到hbase时,mapper任务可能会发生找不到分区文件错误 错误信息如下: Error: java.lang.IllegalArgumentException: Can't read partitions file at org.apa...

2019-07-19 16:58:41

阅读数 194

评论数 0

原创 HBase BulkLoad 导入大量数据

HBase常用写入数据方式 1、使用MapReduce作业中的TableOutputformat类 //context.write(new ImmutableBytesWritable(Bytes.toBytes(rowkey)), put) 2、使用客户端API //table.put(...

2019-07-19 16:15:14

阅读数 415

评论数 4

原创 hbase集群合并

四个步骤: 1.distcp迁移数据 2.恢复hbase元数据 hbase hbck 3.停止原集群 4.将原集群机器加入新的集群 hadoop跨集群迁移数据 hadoop distcp -m 100 hdfs://hostname:9000/hbase/data/default/* h...

2019-03-25 19:36:08

阅读数 158

评论数 0

原创 HBase RowKey设计和预分区

hbase读写性能优化一般可以从三个方面入手 1、hbase服务端读写配置 2、hbase客户端配置 3、hbase表的设计 本文从表设计的rowkey和预分区角度优化hbase读写性能,避免region读写热点问题。 一、hbase数据读取方式 先了解hbase读取数据方式: 1、...

2019-03-25 17:50:24

阅读数 389

评论数 0

原创 HBase写入报错:org.apache.hadoop.hbase.RegionTooBusyException: Above memstore limit

大量写请求场景,经常出现以下错误: org.apache.hadoop.hbase.RegionTooBusyException: Above memstore limit xxx memstoreSize=1094171984, blockingMemStoreSize=1073741824 ...

2019-03-21 00:23:06

阅读数 1220

评论数 3

原创 PageRank算法及基于Spark的实现

目录 1、PageRank概述 2、PageRank原理 3、PageRank代数推导论证(稍微有点点复杂,看不是很明白可以略过) 4、PageRank分布式实现(Spark) 5、PageRank优缺点 6、改进 “在互联网上,如果一个网页被很多其他网页所链接,就说明它受到普遍的承...

2018-11-20 17:30:58

阅读数 590

评论数 0

原创 IK分词器 原理分析 源码解析

IK分词器在是一款基于词典和规则的中文分词器。本文讲解的IK分词器是独立于elasticsearch、Lucene、solr,可以直接用在java代码中的部分。关于如何开发es分词插件,后续会有文章介绍。 IK分词器的源码:Google Code,直接下载请点击这里。 一、两种分词模式 ...

2018-10-30 12:01:14

阅读数 3257

评论数 5

原创 elasticsearch 6.2.3 安装IK分词器 及 IK分词器简单使用demo

Ik分词器github,本文参考了该内容。 IK分词器与elasticsearch 有版本对应关系,点击这里 安装 一、安装 第一种方式:下载预编译好的IK:https://github.com/medcl/elasticsearch-analysis-ik/releases,解压到你的...

2018-10-24 11:27:13

阅读数 443

评论数 0

提示
确定要删除当前文章?
取消 删除