Bitmap
(1)bitmap原理
所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。
(2)应用范围
Bitmap算法可用于处理大量数据的排序、查询以及去重。缓存系统中的 布隆过滤器 就是利用了bitmap算法实现。实际应用中一般超过亿级应用使用
(3)php实现bitmap进行数组排序
<?php
/**
* +----------------------------------------------------------------------
* |Created by PhpStorm.
* +----------------------------------------------------------------------
* |User: gongxulei <email:790707988@qq.com>
* +----------------------------------------------------------------------
* |Date: 2020/9/12
* +----------------------------------------------------------------------
* |Time: 3:06 下午
* +----------------------------------------------------------------------
*/
class Bitmap
{
private $max_number;
private $bitmapArr;
private $php_int_bit_size;
private $outputSortArr = [];
public function __construct(int $max_number = 10)
{
$this->max_number = $max_number;
//设置php bitmap存储数组
$this->bitmapArr = array_fill(0, $max_number, 0);
//php中默认 int类型占用空间为8byte,即:64bit。如果数组个数设置为的10个,则存储最大不能超过 10 * 64 = 640;
$this->php_int_bit_size = PHP_INT_SIZE * 8;
}
public function shiftBit(array $sortArray = [])
{
foreach ($sortArray as $value) {
if ($this->php_int_bit_size * $this->max_number < $value) {
throw new \Exception('排序数组中' . $value . '超出最大值,请设置合适的数组', 400);
}
$quotient = $value / $this->php_int_bit_size;
$quotient = floor($quotient);
$remainde = $value % $this->php_int_bit_size;
$this->bitmapArr[$quotient] = $this->bitmapArr[$quotient] | (1 << $remainde);
}
return $this->bitmapArr;
}
public function outputSortResult()
{
foreach ($this->bitmapArr as $key => $item) {
for ($i = 0; $i < $this->php_int_bit_size; $i++) {
if ((1 << $i) & $item) {
//存在数字
$this->outputSortArr[] = $key * $this->php_int_bit_size + $i;
}
}
}
return $this->outputSortArr;
}
}
测试结果:
$BitMap = new Bitmap(20);
$BitMap->shiftBit([10, 6, 3, 4, 5, 8, 2, 3, 600, 100, 640, 400, 200, 350]);
$sortResult = $BitMap->outputSortResult();
var_dump($sortResult);
array(13) {
[0]=>
int(2)
[1]=>
int(3)
[2]=>
int(4)
[3]=>
int(5)
[4]=>
int(6)
[5]=>
int(8)
[6]=>
int(10)
[7]=>
int(100)
[8]=>
int(200)
[9]=>
int(350)
[10]=>
int(400)
[11]=>
int(600)
[12]=>
int(640)
}
redis设置布隆过滤器
如项目A的布隆过滤器key为 bitmap_projetcA
通过hash函数将缓存key转换为数字,然后设置bitmap
127.0.0.1:7001 > setbit bitmap_projetcA 10 1
127.0.0.1:7001 > getbit bitmap_projetcA 10
(integer) 1
注意:由于存在hash碰撞,因此在获取bitmap中值如果存在,那实际不一定存在,如果不存在,那就一定不存在