自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Solr BlockCache

Solr BlockCache概述源码分析初始化BlockCacheBlockDirectoryCacheBlockDirectory写流程读流程概述Solr 中为了加速索引在 HDFS 上的读写,增加了缓存,相关代码均位于 org.apache.solr.store.blockcache 包中。源码分析本篇源码基于 lucene-solr-8.5.2。初始化初始化的过程位于 HdfsDirectoryFactory 的 create 方法中,启用 BlockCache 需要配置对应参数,可参考

2021-04-21 10:40:57 258

原创 HBase 配置概要

配置文件hbase-env.shhbase-site.xmlhbase-env.sh前面的一些脚本中有加载 hbase-env.sh 中的环境变量,这些变量都是给用户提供的可配置项。它设置了 HBase 运行中的一些重要 JVM 参数,在对 HBase 进行调优时可能会用到。文件格式是以export 环境变量名=变量值这种形式组织的JAVA_HOME - JDK 路径,Java 1.8+HBASE_CLASSPATH - 额外的 Java CLASSPATH,可选项HBASE_HE

2020-12-16 16:44:51 283

原创 HBase 启停流程分析(下)

停止流程stop-hbase.sh附 4stop-hbase.sh停止 hadoop hbase 守护程序,在主节点上运行以停止整个 HBase 服务。# 仿照 $HADOOP_HOME/bin/stop-hbase.sh.bin=`dirname "${BASH_SOURCE-$0}"`bin=`cd "$bin">/dev/null; pwd`# 加载环境变量和参数. "$bin"/hbase-config.sh. "$bin"/hbase-common.sh# 停止命令需

2020-12-16 15:17:35 514 2

原创 HBase 启停流程分析(上)

启动流程start-hbase.sh附 1附 2hbase-config.shhbase-daemons.shhbase-daemon.shhbase-common.shzookeepers.sh附 3master-backup.shregionservers.shbin/hbase版本:hbase-2.2.4说明:分析展现的源码和脚本中会省略一部分,只保留与分析相关联的,感兴趣的可自行查阅。start-hbase.sh启动 HBase 的入口,有两种模式:单机模式和集群模式,何种模式取决于用户的配

2020-12-15 17:56:40 486

原创 Lucene源码分析 - 倒排索引之索引表

概要前文已经介绍过什么是倒排索引了,本文将对倒排索引的结构深入进行理解,见下图整个倒排索引其实分为两部分,左边是Term Dictionary,右边是Postings List,例如对以下内容建立倒排索引,结构较为贴近HashMap>,可类比设想Map的key为Term,value为Postings...

2020-03-14 16:30:48 1118

原创 Lucene源码分析 - 索引创建过程

Lucene的诞生背景传统数据库常见数据结构: 结构化数据:表、字段表示的数据 半结构化数据:xml、html等 非结构化数据:文本、文档、图片、音频、视频等 索引原理:对列值创建排序存储,数据结构={列值、行地址},在有序数据列表中就可以利用二分查找快速找到要查找的行的地址,再根据地址直接取行数据 索引特点:数据库适合结构化数据的精确查询,而不适合半结构化、非结构化数...

2019-08-21 11:02:18 1058

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除