单线程内存拷贝速度居然比硬盘写入还慢?

文章探讨了在不同块大小下,内存未预热和预热后的单线程顺序拷贝性能。初次拷贝因内存冷状态导致速度较慢,但随着预热,特别是大块内存拷贝速度显著提升并稳定在较高速率。解释了MMU地址映射机制对速度的影响以及冷热内存的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

硬件环境

CPU: Intel® Xeon® Gold 6346 CPU @ 3.10GHz

MEM: 256G

OS: ubuntu 22.04

单线程顺序拷贝

10G Src Buffer —> 10G Dst buffer

分别按照 4K, 4M,64MB, 1GB的块大小进行拷贝。

使用的是 2MB Pagesize的大页内存,确保内存的连续性。

单线程顺序拷贝代码

int test_block2block(unsigned long block_size)
{
   
    unsigned long i , cnt = 0;
    unsigned long block_num = MEM_SIZE / block_size;
    struct timeval start_time, end_time;
    double elapsed_time;
    gettimeofday(&start_time, NULL);
    
    for (i = 0; i < block_num; ++i) {
   
        void* src = buf + block_size * i;
        void* dest = dest_buf + block_size * i;
        memcpy(dest, src, block_size);
        //memset(dest, cnt, BUF_SIZE);
        cnt++;
    }

    //memcpy(dest_buf, buf, BUF_SIZE*MAX_NUM);
    gettimeofday(&end_time, NULL);
    elapsed_time = (end_time.tv_sec - start_time.tv_sec) +
                (end_time.tv_usec - start_time.tv_usec) / 1000000.0;
    unsigned long long pps = block_num / elapsed_time;
    unsigned long long Bps = MEM_SIZE / elapsed_time;
    char formatbuf[32] = 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值