在不清楚数据表字段数据分布的情况下,应该创建什么类型的索引?

在讨论之前,先看看关系型数据库常见的索引类型:

1.位图索引,适用于该字段重复数据很多的情况;

2.B+树索引,适用于该字段重复数据不多的情况。

在不清楚数据表字段数据分布的情况下,应该创建什么类型的索引?个人觉得以上两种都不太适用,可以尝试使用第3类的索引:

3.倒排索引,在搜索引擎使用较多,适用于大多数的情况。

使用普通的文本文件格式存储倒排索引,格式为:

value:rowid(行标识码),字段值对应value,rowid对应该行的标识码。

要注意的是,在创建倒排索引时,倒排索引的key需要按ascii码排序。

同时,为了加快搜索的速度,为倒排索引创建索引的元数据,包括:

1.倒排索引文件的最大值和最小值。

2.倒排索引文件索引。

样例元数据如下:

[data]

min:1(该字段最小值)

max:100(该字段最大值)

[index]

1:value,offset(索引文件第1行的字段值和索引文件的偏移量)

10000:value,offset(索引文件第10000行的字段值和索引文件的偏移量)

......

n:value,offset(索引文件第n行的字段值和索引文件的偏移量)


在实际查询时,给出查询条件,通过读取索引的元数据可以很快的定位到该查询条件对应的倒排索引,再通过倒排索引查询数据。


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/6906/viewspace-1991374/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/6906/viewspace-1991374/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值