用bitmap减少hash算法所用空间

 

 

hash的空间复杂度又相对比较大,所以用bitmap来减少hash算法所需的空间。

一般的hash,例如对数组[2, 3, 5, 10] 运用桶排序算法,需要声明10个整数的bucket,如下图所示:

0110100001
12345678910

但是如果用bitmap的话,只需一个整数,因为一个整数(32位机)的话有32bit,每个bit都能map一个整数,如下图所示:

         1  1 11 
31303210319543210
数组元素1数组元素0

所以关键就是位操作set, clear, test:

 

#define BITSPERWORD 32
#define SHIFT 5
#define MASK 0x1f

typedef long long int64;

int array[100000];

/**
*
*   i  / 32   对应具体数组元素

*   i % 32  对应具体数组元素的bit位
*   i >> SHIFT == i /  32
*   i &  MASK   == i % 32
*   (32) = (100000)
*
**/

void set(int64 i)
{
    array[ i >> SHIFT]  |= ( 1 << ( i  &  MASK));
}

void clear(int64 i)
{
    array[ i >> SHIFT]  &= ~( 1 << ( i  & MASK));
}

int  test(int64 i)
{
    return array[ i >> SHIFT]  & ( 1 << ( i  &  MASK));
}

 

 

如某公司面试题:

 

在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可。

10G整数做bitmap需要10G/32 = 0.3G 个整数(< 32位机器总共可以的2^31-1 = 2G个整数),0.3G个整数只需要0.3G*4=1.2G的存储空间,故可以只扫描一遍,就可以求出中位数。

 

>----------------------------------------------------------------------------------------------<

 

 

简单的说就是用数组存放若有数据就标志为1true,若不存在标志为0false。比如1225,这里最大值为505中不存034,所以:

Array[0]=0Array[1]=1Array[2]=2Array[3]=0Array[4]=0Array[5]=1

上面数中由于2有两个,所以用int存数组的值(于给上面所说的每一位扩展了一个counter,用空间换能力),不用boolean型,这样如果有多个同样的数字可以用值表示个数。如上面Array[2]=2,就表示22个。

 

这样排序就方便多了,比如上面开始是{2,5,2,1}这样一无序数组A。找出最大值:5.即用来作位图排序的数组B要申请的大小为5.循环这个数组,把数组A的值用作数组B的下标,如果存在就把值加1,即数组B的值为对应的个数。

    for (int i : A) {

           B[i]++;

    }

这样B的值最后同上面的Array一样。把B值大于0的输出就是排好序的了。如上面的数组大于0依次有:1,2,2,5.

 

从上面可以看出位图排序至少要注意两点:

1、  最大值和最小值之间不能相差太大,否则浪费空间。

2、  如果有负数,上面要转换一下,最申请的空间大小为max-min+1,数组B的下标也要作对应的转换,输出前也要转换回去。如int[] arr = { 1, 3, -3, 0, 0};

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BITMAP调度算法是一种常用的内存管理算法,用于管理分配和释放内存块。下面是一个使用C语言实现BITMAP调度算法的示例代码: ```c #include <stdio.h> #include <stdlib.h> #include <stdbool.h> #define MAX_BLOCKS 1024 #define BLOCK_SIZE 4096 typedef struct { unsigned char* bitmap; unsigned char* memory; } BitmapScheduler; BitmapScheduler* createScheduler() { BitmapScheduler* scheduler = (BitmapScheduler*)malloc(sizeof(BitmapScheduler)); scheduler->bitmap = (unsigned char*)calloc(MAX_BLOCKS / 8, sizeof(unsigned char)); scheduler->memory = (unsigned char*)malloc(MAX_BLOCKS * BLOCK_SIZE * sizeof(unsigned char)); return scheduler; } void destroyScheduler(BitmapScheduler* scheduler) { free(scheduler->bitmap); free(scheduler->memory); free(scheduler); } void* allocateBlock(BitmapScheduler* scheduler) { for (int i = 0; i < MAX_BLOCKS; i++) { int byteIndex = i / 8; int bitIndex = i % 8; if ((scheduler->bitmap[byteIndex] & (1 << bitIndex)) == 0) { scheduler->bitmap[byteIndex] |= (1 << bitIndex); return scheduler->memory + (i * BLOCK_SIZE); } } return NULL; } void freeBlock(BitmapScheduler* scheduler, void* block) { int blockIndex = ((unsigned char*)block - scheduler->memory) / BLOCK_SIZE; int byteIndex = blockIndex / 8; int bitIndex = blockIndex % 8; scheduler->bitmap[byteIndex] &= ~(1 << bitIndex); } void printBitmap(BitmapScheduler* scheduler) { printf("Bitmap:\n"); for (int i = 0; i < MAX_BLOCKS; i++) { int byteIndex = i / 8; int bitIndex = i % 8; bool allocated = (scheduler->bitmap[byteIndex] & (1 << bitIndex)) != 0; printf("%d ", allocated); if ((i + 1) % 32 == 0) { printf("\n"); } } } int main() { BitmapScheduler* scheduler = createScheduler(); // 分配内存块 void* block1 = allocateBlock(scheduler); void* block2 = allocateBlock(scheduler); void* block3 = allocateBlock(scheduler); // 释放内存块 freeBlock(scheduler, block2); // 打印位图 printBitmap(scheduler); destroyScheduler(scheduler); return 0; } ``` 这个示例代码实现了BITMAP调度算法的内存分配和释放功能。通过`allocateBlock`函数可以分配一个内存块,通过`freeBlock`函数可以释放一个内存块。`printBitmap`函数用于打印当前的位图情况。 希望对你有帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值