面向高能物理的大数据管理系统

eventdb是一个面向高能物理的系统,利用HBase存储数据并进行高效查询。文章详细介绍了其环境依赖、配置文件、RowKey编码、存储结构、HBase数据表创建、ROOT分析、多线程并行处理以及批量导入和查询操作。
摘要由CSDN通过智能技术生成

eventdb

面向高能物理的大数据管理系统

环境依赖

  1. 分析dst文件需要Root环境依赖
  2. 解决python依赖:pip install happybase ConfigParser optparse pydoop
  3. java依赖通过maven解决,工程根目录运行:mvn clean compile && mvn clean package
  4. hadoop&hbase环境依赖:确保jps中有ResourceManager和Thrift服务

配置文件

配置文件./config.ini说明hdfs和hbase的运行环境, 本地环境可以使用默认配置。

rowkey编码

hbase只有字符类型,但是数字的大小顺序和字符顺序不匹配,导致针对属性值的范围搜索失效。为了使数字的大小顺序和字符顺序匹配,对数字进行编码。c代码./c/TyperSer.c可以对整数和浮点数进行编码。./python/lib/TyperSer.so是编译生成的动态链接。

eventdb存储结构

为了加快生成hbase数据表的速度,将生成的倒排索引存储在hdfs文件中,hbase表结构为rowkey, data:run, data:offset, data:length, data:count。一个run生成一个hdfs数据文件,data:run指向这个文件名,data:offset指向当前rowkey的倒排索引字符串在文件中的偏移量,data:length说明字符串的长度,data:count说明有多少个entryID。所以查询的时候先在hbase中查询,再通过offset等文件信息在hdfs文件中读取倒排索引。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值