利用位图(Bit Map)和二分查找实现快速查找算法

一:应用背景

     快速查找海量字符串数组中查找是否包含某个字符串(密文),应用于实验室的分布式破译系统中。

二:实现主要思路

   2.1 构造位图(bitMap),位图的每个bit对应一条密文,即密文映射到位图某个bit上,采用特定的hash函数计算映射地址,位图的大小根据碰撞系数可变化。位图过小,那么越多的明文字符串就会映射到同一个bit上,从而导致查找性能下降。位图查找的时间复杂度为O(1)

   2.2 二分查找实现密文字符串的精确查找,二分查找的时间复杂度为O(log(n))

GPU上的上千万条线程会同时暴力计算每一个候选明文,计算出来的密文会和给定的密文进行比较查找,查找过程如下:先通过位图查找该密文字符串是否可能在密文数组中(由于hash函数的碰撞性并不能保证一定性,所以才需要二分查找进行精确的查找),如果通过位图查找,则进入二分查找阶段进行精确的查找。位图的目的是刷选掉绝大部分不符合的密文字符串,从而减少二分查找的次数,最终提高性能。


三:串行代码

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <malloc.h>
#include <string.h>
#include <assert.h>
#include <sys/time.h>

#define BITMAP_MIN	16
#define BITMAP_MAX	24
#include <iostream>
using namespace std;
void *mymalloc(size_t size);
void *myrealloc(void *ptr, size_t oldsz, size_t add);
void myfree (void *ptr);
static uint32_t generate_bitmaps (const uint32_t digests_cnt, const uint32_t dgst_size, const uint32_t dgst_shifts, uint32_t *digests_buf_ptr, const uint32_t bitmap_mask, const uint32_t bitmap_size, uint32_t *bitmap_a, uint32_t *bitmap_b, uint32_t *bitmap_c, uint32_t *bitmap_d, const uint64_t collisions_max);
static uint32_t check (const uint32_t digest[2], uint32_t *bitmap_s1_a, uint32_t *bitmap_s1_b, uint32_t *bitmap_s1_c, uint32_t *bitmap_s1_d, uint32_t *bitmap_s2_a, uint32_t *bitmap_s2_b, uint32_t *bitmap_s2_c, uint32_t *bitmap_s2_d, const uint32_t bitmap_mask, const uint32_t bitmap_shift1, const uint32_t bitmap_shift2);
static int find_hash (const uint32_t digest[4], const uint32_t digests_cnt, uint32_t *digests_buf, uint32_t dgst_size);

void low_ToBinary(char *in ,uint8_t *out ,int length) {
    if(strlen(in) != length) {
		printf("\n low_ToBinary error !!  in_len: %d != %d\n",strlen(in),length);
        return;
	}
    for(int i = 0; i < length; i+=2) {
        unsigned char tmp = 0;
        if(in[i] >= 'a' && in[i] <= 'z') {
            tmp += in[i] - 'a' + 10;
        }
        else if(in[i] >= 'A' && in[i] <= 'Z') {
            tmp +=in[i] - 'A' + 10;
        }
        else if(in[i] >= '0' && in[i] <= '9') {
            tmp += in[i] - '0';
        }
        tmp = tmp * 16;
        if(in[i+1] >= 'a' && in[i+1] <= 'z')
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
下面是一个使用C语言实现位图算法的简单示例: ```c #include <stdio.h> #include <stdlib.h> #define BITMAP_SIZE 32 // 设置位图中指定位置的位为1 void setBit(unsigned int* bitmap, int pos) { int index = pos / 32; int offset = pos % 32; bitmap[index] |= (1u << offset); } // 设置位图中指定位置的位为0 void clearBit(unsigned int* bitmap, int pos) { int index = pos / 32; int offset = pos % 32; bitmap[index] &= ~(1u << offset); } // 检查位图中指定位置的位是否为1 int checkBit(unsigned int* bitmap, int pos) { int index = pos / 32; int offset = pos % 32; return (bitmap[index] & (1u << offset)) != 0; } int main() { // 创建一个位图数组,大小为BITMAP_SIZE个无符号整数 unsigned int* bitmap = (unsigned int*)malloc(sizeof(unsigned int) * BITMAP_SIZE); // 初始化位图,将所有位都设置为0 for (int i = 0; i < BITMAP_SIZE; i++) { bitmap[i] = 0; } // 设置第5、10和15位置的位为1 setBit(bitmap, 5); setBit(bitmap, 10); setBit(bitmap, 15); // 检查第5和20位置的位是否为1 if (checkBit(bitmap, 5)) { printf("Bit at position 5 is set.\n"); } else { printf("Bit at position 5 is not set.\n"); } if (checkBit(bitmap, 20)) { printf("Bit at position 20 is set.\n"); } else { printf("Bit at position 20 is not set.\n"); } // 清除第10位置的位 clearBit(bitmap, 10); // 检查第10位置的位是否为1 if (checkBit(bitmap, 10)) { printf("Bit at position 10 is set.\n"); } else { printf("Bit at position 10 is not set.\n"); } free(bitmap); return 0; } ``` 这个示例中,我们定义了`BITMAP_SIZE`为32,表示位图的大小为32个无符号整数。然后,我们使用`setBit`函数设置位图中指定位置的位为1,使用`clearBit`函数清除位图中指定位置的位为0,使用`checkBit`函数检查位图中指定位置的位是否为1。最后,我们通过一些示例操作来演示位图的使用。 请注意,这只是一个简单的示例,实际应用中可能需要更复杂的位图算法来满足具体需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值