数据结构：位图

最新推荐文章于 2022-04-11 15:37:42 发布

ChaseRaod

最新推荐文章于 2022-04-11 15:37:42 发布

阅读量409

点赞数

分类专栏：数据结构文章标签：数据结构

本文链接：https://blog.csdn.net/chaseraod/article/details/76863144

版权

数据结构专栏收录该内容

26 篇文章 1 订阅

订阅专栏

所有比特的编号方法是，从低字节的低位比特位开始，第一个bit为0，最后一个bit为 2^(n-1)。

比如说，现在有个数组是这样子的，int a[4]，那么
a[0]的比特位为0——31
a[1]的比特位为32——63
a[2]的比特位为64——95
a[3]的比特位为96——127

比如说现在我们有100这个数，于是，我们要将第100位置为1，也就是说，我们最少得有100位，100位等于12.5字节，因为一个int型是4个字节，所以我们必须定义一个这样的数组int[4]，数组的位模型可以参考上面。现在，我们要对这个数组的100位进行置位操作，那首先我得先知道100是在这个数组中的第几个元素，所以，使用100/32，我现在要第100位，然后，每个数组元素是32位，进行运算之后，我就得到了我要置的位在那一个元素了，那确定了元素之后，我得知道，我要置位的是元素的哪一个位，所以我就得知道求余的结果，所以就100%32，得到要置位的位置了。

#pragma once
#include<iostream>
using namespace std;
#include<vector>

class BitMap
{
public:
    BitMap(size_t range)
    {
        _a.resize((range >> 5) + 1);//右移5位表示除以32
    }

    void Set(size_t value)//置1
    {
        size_t index = value / 32;
        size_t num = value % 32;
        _a[index] |= (1 << num);
    }

    void ReSet(size_t value)//置0
    {
        size_t index = value / 32;
        size_t num = value % 32;
        _a[index] &= (~(1 << num));
    }

    bool Test(size_t value)
    {
        size_t index = (value >> 5);
        size_t num = value % 32;
        return _a[index] & (1 << num);
    }//非0则存在
protected:
    vector<int> _a;
};

void TestBitMap()
{
    BitMap bm(-1);//全1
    bm.Set(1000);
    bm.Set(1005);
    bm.Set(1006);
    cout << bm.Test(1000) << endl;
}

这里写图片描述

如果把测试用例改为如下：

void TestBitMap()
{
    BitMap bm(-1);//全1
    bm.Set(1000);
    bm.Set(1005);
    bm.Set(1006);
    cout << bm.Test(1003) << endl;
}

运行结果为：
这里写图片描述

位图的优缺点：
优点：
（1）速度快
（2）内存空间占用小
（3）能表示大范围的数据
缺点：
（1）可读性差
（2）位图存储的元素个数虽然比一般做法多，但是存储的元素大小受限于存储空间的大小。位图存储性质：存储的元素个数等于元素的最大值。比如， 1K 字节内存，能存储 8K 个值大小上限为 8K 的元素。（元素值上限为 8K ，这个局限性很大！）比如，要存储值为 65535 的数，就必须要 65535/8=8K 字节的内存。要就导致了位图法根本不适合存 unsigned int 类型的数（大约需要 2^32/8=5 亿字节的内存）。
（3）位图对有符号类型数据的存储，需要 2 位来表示一个有符号元素。这会让位图能存储的元素个数，元素值大小上限减半。比如 8K 字节内存空间存储 short 类型数据只能存 8K*4=32K 个，元素值大小范围为 -32K~32K 。

位图的应用
1、给40亿个不重复的unsigned int的整数，没排过序的，然后再给一个数，如何快速判断这个数是否在那40亿个数当中
　　首先，将这40亿个数字存储到bitmap中，然后对于给出的数，判断是否在bitmap中即可。
2、使用位图法判断整形数组是否存在重复
遍历数组，一个一个放入bitmap，并且检查其是否在bitmap中出现过，如果没出现放入，否则即为重复的元素。
3、使用位图法进行整形数组排序
首先遍历数组，得到数组的最大最小值，然后根据这个最大最小值来缩小bitmap的范围。这里需要注意对于int的负数，都要转化为unsigned int来处理，而且取位的时候，数字要减去最小值。
4、在2.5亿个整数中找出不重复的整数，注，内存不足以容纳这2.5亿个整数
参考的一个方法是：采用2-Bitmap（每个数分配2bit，00表示不存在，01表示出现一次，10表示多次，11无意义）。其实，这里可以使用两个普通的Bitmap，即第一个Bitmap存储的是整数是否出现，如果再次出现，则在第二个Bitmap中设置即可。这样的话，就可以使用简单的1- Bitmap了。

ChaseRaod

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构：位图

所有比特的编号方法是，从低字节的低位比特位开始，第一个bit为0，最后一个bit为 2^(n-1)。比如说，现在有个数组是这样子的，int a[4]，那么 a[0]的比特位为0——31 a[1]的比特位为32——63 a[2]的比特位为64——95 a[3]的比特位为96——127比如说现在我们有100这个数，于是，我们要将第100位置为1，也就是说，我们最少得有100位，100位等于12.
复制链接

扫一扫