内存优化(基于ESP32)

主要参考资料:
【ESP32-IDF】03-1 系统-内存管理: https://blog.csdn.net/espressif/article/details/112956403
一分钟带你读懂C语言中三种内存分配方式: https://blog.csdn.net/m0_58857034/article/details/132038652

1.内存分段

操作系统分配给进程的内存空间中包含五种段:数据段、代码段、堆、栈。

栈:存放程序中的临时的局部变量和函数的参数值。
堆:存放进程运行中被动态分配的内存,其大小不固定。
数据段:存放程序中的静态变量和已初始化且不为零的全局变量。
代码段:存放可执行文件的操作指令,代码段是只读的,不可进行写操作。这部分的区域在运行前已知其大小。
在这里插入图片描述

2.ESP32 内存模型

2.1片内RAM

2.1.1 片内RAM

在这里插入图片描述
上图是ESP32内部存储器的布局,SRAM分为3个存储块SRAM0,SRAM1和SRAM2。(还有RTC快速和慢速存储器)

按照功能,SRAM可以分为两种:

  • IRAM: 存储指令的RAM,存储的是代码段(text段)。IRAM可以使用SRAM0和SRAM1
  • DRAM: 存储数据的RAM,主要用来存储BSS段,数据段,堆区和栈区的数据。DRAM可以使用SRAM1和SRAM2
    在这里插入图片描述

虽然理论上,SRAM1可以用于存储IRAM和DRAM,但是实际上,RAM的默认分配情况是

  • IRAM:192KB,占用SRAM0
  • DRAM:328KB 占用SRAM1和SRAM2

但是值得注意的是,IRAM和DRAM的地址范围方向是相反的。

在这里插入图片描述

2.1.2 IRAM组织结构

在这里插入图片描述
接下来单独看看IRAM里面包括什么

ESP32 中 192 KB 的可用 IRAM 用于代码执行,并且其中一部分作为高速缓存(Cache)用于访问 Flash(和 PSRAM )。

  • 前 32KB IRAM 用作 CPU0 的高速缓存,接下来的 32KB 用作 CPU1 高速缓存。这是在硬件中静态配置的,无法更改。
  • 在第一个 64KB 之后,链接脚本开始将 text 段放置在 IRAM 中。它首先放置所有中断向量,然后放置已编译应用程序中所有标记为放置在 IRAM 中的 text 段。在通常情况下,大多数应用程序代码从 flash (XiP)执行,但某些代码对执行时间有较高要求,或者本身需要操作 flash,需要将它们放置在 IRAM 中。这项操作通过对这些函数或代码文件添加特定属性标识实现,链接程序脚本将据属性标识将它们放置在 IRAM 中。链接脚本将 _iram_text_start 和 _iram_text_end 符号放置在 text 段的两个边界处。
  • text 段之后的 IRAM 保持未使用状态,并添加到堆中。

当应用程序配置为单核模式时,CPU1 不工作并且不启用 CPU1 Cache。在这种情况下,CPU1 Cache 的空间(0x40078000–0x4007FFFF)将被添加到堆中。

IRAM 也可以用于放置数据,但有两个重要限制条件:

  • 用于访问 IRAM 中数据的地址必须是 32 位对齐的;
  • 访问的数据大小也必须是 32 位对齐的。

2.1.3 DRAM组织结构

在这里插入图片描述
上图显示了应用程序的典型(简化)DRAM 布局。由于 DRAM 地址从 SRAM2 的末尾开始,并向后增加,因此链接阶段段空间的分配从 SRAM2 的末尾开始。

  • 前 8KB(0x3FFA_E000–0x3FFA_FFFF)用作某些 ROM 内置函数的数据空间;链接器紧接着将已初始化的数据段放在第一个 8KB 存储器之后;
  • 接下来是未初始化的 BSS 段;
  • 数据段和 BSS 段之后剩余的内存被配置为堆,典型的动态内存分配一般分配至该位置。

2.1.4 启用蓝牙之后的DRAM

在这里插入图片描述
启用蓝牙(BT)功能后, BT 控制器(软件和硬件)需要使用专用的数据空间。该空间作为控制器的 Data/BSS 段,同时作为传输空间用于 BT 数据包在软件和硬件之间传输。因此,链接脚本在默认的 DRAM 空间中保留了 0x3FFB_0000–0x3FFB_DB5C 之间的 54KB 空间,在该区域之后才进行应用程序的数据段和 BSS 段分配。

当应用程序仅使用低功耗蓝牙(BLE)功能时,可以将 BT 控制器内存的一部分交还给堆。释放并添加到堆中的内存大小约为 19KB。

2.1.5 启用跟踪调试空间之后 DRAM 组织结构

在这里插入图片描述
应用程序级的跟踪调试(Trace)启用以后,它将在 DRAM 的末尾保留一个固定为 32KB 的内存空间。请注意,上图显示了未启用 BT 时的内存布局。但是应用程序也可以在启用BT的情况下使用跟踪,在这种情况下,链接脚本中也会保留 BT 控制器的内存空间。

2.2 片外RAM

3. ESP32 内存的使用

3.1 IRAM

ESP-IDF 将内部 SRAM0 区域(在技术参考手册中有定义)的一部分分配为指令 RAM。除了开始的 64kB 用作 PRO CPU 和 APP CPU 的高速缓存外,剩余内存区域(从 0x40080000 至 0x400A0000 )被用来存储应用程序中部分需要在RAM中运行的代码。

一些 ESP-IDF 的组件和 WiFi 协议栈的部分代码通过链接脚本文件被存放到了这块内存区域。

如果一些应用程序的代码需要放在 IRAM 中运行,可以使用 IRAM_ATTR 宏定义进行声明。

#include "esp_attr.h"

void IRAM_ATTR gpio_isr_handler(void* arg)
{
    // ...
}

下面列举了应用程序中可能或者应该放入 IRAM 中运行例子。

  • 当注册中断处理程序的时候设置了 ESP_INTR_FLAG_IRAM ,那么中断处理程序就必须要放在 IRAM 中运行。这种情况下,ISR 只能调用存放在 IRAM 或者 ROM 中的函数。 注意 :目前所有 FreeRTOS 的 API 都已经存放到了 IRAM 中,所以在中断中调用 FreeRTOS 的中断专属 API 是安全的。如果将 ISR 放在 IRAM 中运行,那么必须使用宏定义 DRAM_ATTR 将该 ISR 用到所有常量数据和调用的函数(包括但不限于 const char 数组)放入 DRAM 中。

  • 可以将一些时间关键的代码放在 IRAM 中,这样可以缩减从 Flash 加载代码所消耗的时间。ESP32 是通过 32kB 的高速缓存来从外部 Flash 中读取代码和数据的,将函数放在 IRAM 中运行可以减少由高速缓存未命中引起的时间延迟。

3.2 IROM

如果一个函数没有被显式地声明放在 IRAM 或者 RTC 内存中,则将其置于 Flash 中。Flash 技术参考手册中介绍了 Flash MMU 允许代码从 Flash 执行的机制。ESP-IDF 将从 Flash 中执行的代码放在 0x400D0000 — 0x40400000 区域的开始,在启动阶段,二级引导程序会初始化 Flash MMU,将代码在 Flash 中的位置映射到这个区域的开头。对这个区域的访问会被透明地缓存到 0x40070000 — 0x40080000 范围内的两个 32kB 的块中。

3.3 RTC快速内存

从深度睡眠模式唤醒后必须要运行的代码要放在 RTC 内存中

3.4 DRAM

链接器将非常量静态数据和零初始化数据放入 0x3FFB0000 — 0x3FFF0000 这 256kB 的区域。注意,如果使用蓝牙堆栈,此区域会减少 64kB(通过将起始地址移至 0x3FFC0000 )。如果使用了内存跟踪的功能,该区域的长度还要减少 16kB 或者 32kB。放置静态数据后,留在此区域中的剩余空间都用作运行时堆。

常量数据也可以放在 DRAM 中,例如,用在 ISR 中的常量数据(参见上面 IRAM 部分的介绍),为此需要使用 DRAM_ATTR 宏来声明。

DRAM_ATTR const char[] format_string = "%p %x";
char buffer[64];
sprintf(buffer, format_string, ptr, val);

宏 __NOINIT_ATTR 可以用来声明将数据放在 .noinit 段中,放在此段中的数据不会在启动时被初始化,并且在软件重启后会保留原来的值。

例如

__NOINIT_ATTR uint32_t noinit_data;

3.5 DROM

默认情况下,链接器将常量数据放入一个 4MB 区域 (0x3F400000 — 0x3F800000) ,该区域用于通过 Flash MMU 和高速缓存来访问外部 Flash。一种特例情况是,字面量会被编译器嵌入到应用程序代码中。

3.6 RTC慢速内存

从 RTC 内存运行的代码(例如深度睡眠模块的代码)使用的全局和静态变量必须要放在 RTC 慢速内存中。更多详细说明请查看文档 深度睡眠 。

宏 RTC_NOINIT_ATTR 用来声明将数据放入 RTC 慢速内存中,该数据在深度睡眠唤醒后将保持不变。

例如

RTC_NOINIT_ATTR uint32_t rtc_noinit_data;

3.7 DMA

大多数的 DMA 控制器(比如 SPI,SDMMC 等)都要求发送/接收缓冲区放在 DRAM 中,并且按字对齐。我们建议将 DMA 缓冲区放在静态变量中而不是堆栈中。使用 DMA_ATTR 宏可以声明该全局/本地的静态变量具备 DMA 能力,例如:

DMA_ATTR uint8_t buffer[]="I want to send something";

void app_main()
{
    // 初始化代码...
    spi_transaction_t temp = {
        .tx_buffer = buffer,
        .length = 8*sizeof(buffer),
    };
    spi_device_transmit( spi, &temp );
    // 其他程序
}

或者

void app_main()
{
    DMA_ATTR static uint8_t buffer[]="I want to send something";
    // 初始化代码...
    spi_transaction_t temp = {
        .tx_buffer = buffer,
        .length = 8*sizeof(buffer),
    };
    spi_device_transmit( spi, &temp );
    // 其他程序
}

在堆栈中放置 DMA 缓冲区仍然是允许的,但是你必须记住:

  • 如果堆栈在 pSRAM 中,切勿尝试这么做,因为堆栈在 pSRAM 中的话就要按照
    menuconfig 中使能 SPIRAM_ALLOW_STACK_EXTERNAL_MEMORY ),所以请确保你的任务不在 pSRAM 中。
  • 在函数中使用 WORD_ALIGNED_ATTR

宏来修饰变量,将其放在适当的位置上,比如:

void app_main()
{
   uint8_t stuff;
   WORD_ALIGNED_ATTR uint8_t buffer[]="I want to send something";   //否则buffer数组会被存储在stuff变量的后面
   // 初始化代码...
   spi_transaction_t temp = {
      .tx_buffer = buffer,
      .length = 8*sizeof(buffer),
   };
   spi_device_transmit( spi, &temp );
   // 其他程序
}


  • 19
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值