位图法

原创 2016年06月01日 13:59:56

用位图法实现海量数据排序和重复问题

C

#include "stdafx.h"
#include <time.h>
#define BITWORD 32
#define ARRNUM 10000

int mmin = 10000000;
int mmax = 99999999;
int N = (mmax-mmin+1);   //存储的最大数字
#define  BITS_PER_WORD 32
#define WORD_OFFSET(b) ((b) / BITS_PER_WORD)
#define BIT_OFFSET(b)  ((b) % BITS_PER_WORD)
void SetBit(int *words, int n)
{
    n -= mmin;
    words[WORD_OFFSET(n)] |= (1 << BIT_OFFSET(n));
}

 void ClearBit(int *words, int n)
{
    words[WORD_OFFSET(n)] &= ~(1 << BIT_OFFSET(n));//将逻辑位置为n的二进制位置为0
}

 int GetBit(int *words, int n)
{
     int bit = words[WORD_OFFSET(n)] & (1 << BIT_OFFSET(n));//测试逻辑位置为n的二进制位是否为1 
     return bit != 0;
}

 int main( )
{
    int i;
    int j;
    int arr[ARRNUM];
    int* words = new int[1 + N/BITS_PER_WORD]; //建立的位图的大小=存储的最大数字/每个字节的位数+1
    if(words == NULL) {
        cout << "new error\n" << endl;
        exit(0);
    }
    int count = 0;
    /*
    for (i = 0; i < N; i++)
   {
       ClearBit(words, i); //将逻辑位置为n的二进制位置为0
   }
   */
    for (j = 0; j < 1 + N/BITS_PER_WORD; j++)
   {
        words[j]=0;  //直接将该int置0,应该也是可以的
   }
    srand( (unsigned)time( NULL ) );
    printf("数组大小:%d\n", ARRNUM);
    for (j = 0; j < ARRNUM; j++)
   {
        arr[j]= rand( )%N;
        arr[j] += mmin;
        printf("%d\t", arr[j]);
    }
    for (j = 0; j < ARRNUM; j++)
   {
        SetBit(words, arr[j]);
   }

    printf("排序后a为:\n");

    for (i = 0; i < N; i++) 
    {
        if (GetBit(words, i)) {
            printf("%d\t", i+mmin);
            count++;
        }
     }

    printf("总个数为:%d\n",count);
    delete[] words;
    words = NULL;
	system("pause");
    return 0;
 }
C++

#include "stdafx.h"
#include <bitset>
#include <iostream>
#include <time.h>
#include <iomanip>
#define ARRNUM 2500
#define N ARRNUM/(sizeof(int)*8)+1
using namespace std;
 int main( )
{
    int i;
    int cnt=0;
    bitset<ARRNUM> bit;
    
    cout<<"数组大小: "<<ARRNUM<<endl;    
 
    srand((unsigned)time(NULL));
   for (i = 0; i < ARRNUM; i++)
    {
        int tmp= rand( )%ARRNUM;
		bit.set(tmp,1);
        cout<<setw(5)<<tmp<<" ";
    }
	cout<<endl<<"排序后: "<<endl;

	for(i=0;i<ARRNUM;i++){		
	    if(bit[i]==1){
	       cout<<setw(5)<<i<<" ";
	       cnt++;
	    }
	}
    cout<<endl<<"不重复的数目为: "<<cnt<<endl;
    system("pause");
    return 0;
 }


版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

数组中寻找第K小的数----位图法(bitmap)

(1)位图法      所谓bitmap,就是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况。通常是用来判断某个数据存不存在的(百度百科)。       例如:对{0, 1,...

位图法JAVA

位图法 bit-map(位图)法基本原理是使用位数字来表示某些元素是否存在,如8位电话号码中查重复号码,它适用于海量数据的快速查找、判重、删除等。 具体而言,位图是一个N位长的串,我们可用int[...

使用位图法判断整形数组是否存在重复

判断集合中存在重复是常见编程任务之一,当集合中数据量比较大时我们通常希望少进行几次扫描,这时双重循环法就不可取了。 位图法比较适合于这种情况,它的做法是按照集合中最大元素max创建一个长度为ma...

海量数据去重排序--bitmap(位图法)在java中的实现的两种方法

在海量数据中查找出重复出现的元素或者去除重复出现的元素是面试中常考的文图。针对此类问题,可以使用位图法来解决。例如:已知某个文件内包含若干个电话号码,要求统计不同的号码的个数,甚至在O(n)时间复杂度...

位图法的应用

所谓bitmap,就是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况。通常是用来判断某个数据存不存在的。   例如,要判断一千万个人的状态,每个人只有两种状态:男人,女...

位图法应用

位图法是《编程珠玑》第一章中出现的磁盘排序算法。   题目:一个最多包含n个正整数的文件,每个数都小于n,其中n=10^7,且所有正整数都不重复。求如何将这n个正整数升序排列。 约束...

数据结构:位图法(bitmap||BMP)

一、定义        位图法就是bitmap的缩写。所谓bitmap,就是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况。通常是用来判断某个数据存不存在的。在STL中有一个bi...

海量数据处理——位图法bitmap

一、定义        位图法就是bitmap的缩写。所谓bitmap,就是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况。通常是用来判断某个数据存不存在的。在STL中有一个b...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)