对含有含量数据的磁盘文件中的数据进行排序

编程珠玑上说道:

                              可以有两种方法:1、归并 2、位图

但是具体如何实现呢:

首先谈谈归并:

 (问题假设):10^7个不重复的数据量的磁盘文件

源文件大约是40M,所以把源文件分成40分,每份通过快排得到有序,之后对40份有序文件进行归并排序。

声明一个40个大小的临时数据,一次存入每个文件的头一个数字,然后通过最小堆,把第一个堆里的数字存入文件,然后从那个数字所处的文件中读入下一个数字,直到文件都读完。

大约耗时20s,主要是磁盘的读写很耗时

然后谈谈位图:

经过分析发现如果只用一次那么需要的内存大于1M,但是如果分两次那么每次只需0.65M。

对文件进行第一次扫描,如果小于5000000则进行位图表示,写入文件。

对文件进行第二次扫描,如果大于5000000则进行位图表示,写入文件。

耗时6s。

参考代码:

//位图方案解决10^7个数据量的文件的排序问题 
//如果有重复的数据,那么只能显示其中一个 其他的将被忽略 
#include <iostream> 
#include <bitset> 
#include <assert.h> 
#include <time.h> 
using namespace std; 
 
const int max_each_scan = 5000000; 
 
int main() 

    clock_t begin = clock(); 
    bitset<max_each_scan> bit_map; 
    bit_map.reset(); 
     
    // open the file with the unsorted data 
    FILE *fp_unsort_file = fopen("data.txt", "r"); 
    assert(fp_unsort_file); 
    int num; 
 
    // the first time scan to sort the data between 0 - 4999999 
    while (fscanf(fp_unsort_file, "%d ", &num) != EOF) 
    { 
        if (num < max_each_scan) 
            bit_map.set(num, 1); 
    } 
     
    FILE *fp_sort_file = fopen("sort.txt", "w"); 
    assert(fp_sort_file); 
    int i; 
     
    // write the sorted data into file 
    for (i = 0; i < max_each_scan; i++) 
    { 
        if (bit_map[i] == 1) 
            fprintf(fp_sort_file, "%d ", i); 
    } 
     
    // the second time scan to sort the data between 5000000 - 9999999 
    int result = fseek(fp_unsort_file, 0, SEEK_SET); 
    if (result) 
        cout << "fseek failed!" << endl; 
    else 
    { 
        bit_map.reset(); 
        while (fscanf(fp_unsort_file, "%d ", &num) != EOF) 
        { 
            if (num >= max_each_scan && num < 10000000) 
            { 
                num -= max_each_scan; 
                bit_map.set(num, 1); 
            } 
        } 
        for (i = 0; i < max_each_scan; i++) 
        { 
            if (bit_map[i] == 1) 
                fprintf(fp_sort_file, "%d ", i + max_each_scan); 
        } 
    } 
     
    clock_t end = clock(); 
    cout<<"用位图的方法,耗时:"<<endl; 
    cout << (end - begin) / CLK_TCK << "s" << endl; 
    fclose(fp_sort_file); 
    fclose(fp_unsort_file); 
    return 0; 
}

                          

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 智慧社区背景与挑战 随着城市化的快速发展,社区面临健康、安全、邻里关系和服务质量等多方面的挑战。华为技术有限公司提出智慧社区解决方案,旨在通过先进的数字化技术应对这些问题,提升城市社区的生活质量。 2. 技术推动智慧社区发展 技术进步,特别是数字化、无线化、移动化和物联化,为城市社区的智慧化提供了可能。这些技术的应用不仅提高了社区的运行效率,也增强了居民的便利性和安全性。 3. 智慧社区的核心价值 智慧社区承载了智慧城市的核心价值,通过全面信息化处理,实现对城市各个方面的数字网络化管理、服务与决策功能,从而提升社会服务效率,整合社会服务资源。 4. 多层次、全方位的智慧社区服务 智慧社区通过构建和谐、温情、平安和健康四大社区模块,满足社区居民的多层次需求。这些服务模块包括社区医疗、安全监控、情感沟通和健康监测等。 5. 智慧社区技术框架 智慧社区技术框架强调统一平台的建设,设立数据心,构建基础网络,并通过分层建设,实现平台能力及应用的可持续成长和扩展。 6. 感知统一平台与服务方案 感知统一平台是智慧社区的关键组成部分,通过统一的RFID身份识别和信息管理,实现社区服务的智能化和便捷化。同时,提供社区内外监控、紧急救助服务和便民服务等。 7. 健康社区的构建 健康社区模块专注于为居民提供健康管理服务,通过整合医疗资源和居民接入,实现远程医疗、慢性病管理和紧急救助等功能,推动医疗模式从治疗向预防转变。 8. 平安社区的安全保障 平安社区通过闭路电视监控、防盗报警和紧急求助等技术,保障社区居民的人身和财产安全,实现社区环境的实时监控和智能分析。 9. 温情社区的情感沟通 温情社区着重于建立社区居民间的情感联系,通过组织社区活动、一键呼叫服务和互帮互助平台,增强邻里间的交流和互助。 10. 和谐社区的资源整合 和谐社区作为社会资源的整合协调者,通过统一接入和身份识别,实现社区信息和服务的便捷获取,提升居民生活质量,促进社区和谐。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值