stm32简单小实例_分享一种简单、实用的测量程序运行时间的方法

前言

平时我们可能很少去关注程序运行的时间,但是在一些情况下可能需要对程序进行一个整体的复盘、优化。那么,程序运行的时间就是一个可以考虑的方面,可以测一下某些代码块、函数、算法的运行时间,然后整体考虑看看有没有必要进行优化。

之前在某工控类项目中,我就有接到一个任务去测试程序中关键代码的执行时间,并输出报告。当时是使用一个GPIO+示波器进行测试的,也可以使用逻辑分析仪来测。

当时测量的方法很简单:在要测试的代码块/函数之前设置该GPIO的电平为高电平,在要测试的代码块/函数之后设置该GPIO为低电平,使用示波器测高电平的时间,就知道了这一代码块/函数的运行时间。下面就通过实例来介绍一下这种简单而有效的方法。

我这里使用逻辑分析仪来测量,使用小熊派开发板来验证,小熊派的主控为STM32L431RCT6,系统时钟设置为80MHz。

这里顺带提一点题外话,之前有一些初学的读者朋友问我说逻辑分析仪贵不贵。逻辑分析仪有贵的也有便宜的,贵则上千上万元,便宜则有几十、几百。我觉得无论工作、还是学习,都有必要入手一个逻辑分析仪。

653521dd3391c233e4bae86a6801431f.png

本篇笔记的测试用的逻辑分析仪就是某宝上二十几块钱买的,可以满足平时的学习所用。条件有限的学生朋友可以入手。有条件的可以考虑入手几百块钱的。

GPIO+逻辑分析仪测时间

1、测量HAL_Delay函数

STM32的HAL库有给我们提供一个HAL_Delay延时函数,这是一个ms级延时函数。这个延时函数依赖于系统滴答定时器,所以是一个比较精确的延时函数。这里,我们就使用GPIO+逻辑分析仪的方法来测量一下这个延时函数。为了方便测试,我们在while死循环里进行测量。

代码:

4d5eb4e372d65c8907849edca16095c7.png

测量结果:

fd0dc3b11c6d32713d3dbf1e25c24349.png

可见,我们通过逻辑分析仪测出了HAL_Delay(100);运行的时间为100.4315ms,符合我们的预期。这里高电平两侧其实就是低电平部分,只不过低电平持续的时间太短了,在这里看起来像一条竖线,我们放大来看看:

47148bb337fd7f9d47986ba7b1a264eb.png

结果已经很准了,可以满足平时的测量。这种测量很难保证百分之百的精确,小数点后面的那一部分可能是受很多不可控因素的影响,这不在我们本篇文章的讨论范围之内。

我们是想通过这个示例来介绍这种测量方法的使用及证明这种方法是可行的。下面再继续看两个实例。

测量软件延时函数

我们以前刚开始学单片机的时候,经常有用到一些粗略的延时函数,其实现方法就是循环执行n条空语句,以达到一个延时的效果。那么,我们怎么来构造一个us级或ms级的粗略延时函数(软件延时函数)。我们之前看到的粗略延时函数类似这样子:

084a0403af494ee5041ddf5049917fb8.png

这些函数里面需要给出一些循环的次数,这个值是怎么来确定的呢?比如上面这个函数中123这个值是怎么来确定的?我们可以使用GPIO+逻辑分析仪的方法来进行一个简单的确定。

确定1us:

66780d74dc0fe51359cc69d50aafae30.png
2ae482795231c3107d21279828e6e376.png

不同的处理器,结果是不一样的。针对小熊派开发板(主控:STM32L431RCT6),循环运行15条空语句的时间实测结果是1.083us,这算是比较接近1us了。我们就运用这个结果来构建一个us级软件延时函数如下:

4c8537e2ee1572302d06fc4a40c58ca7.png

接下来我们测一下soft_delay_us(100);实际运行了多长时间:

0fea17c884195948b6062325e88271db.png
a117859a8978febc9412b0d02b56b3f1.png

可见,结果差不多接近我们想要的结果。构建这样的粗略延时函数可以使用这样的方式来确定一些循环次数的值。

对比查表法与常规法的运行时间

在之前的文章:空间换时间,查表法的经典例子中,我们有说可以适当使用查表法降低程序的执行时间。这里我们来实际测量对比一下那篇文章中查表法与常规法的优劣。

关键代码:

/* 测试结果 */struct test_res{    unsigned int data;  /* 数据          */    unsigned int count; /* 数据中1的个数 */};​/* ============常规法============ */#if 1struct test_res get_test_res(unsigned int data){    /* 保存测试结果 */    struct test_res res;        /* 保证数据总会在0~0xf之间 */    // unsigned int temp = data & 0xf;       unsigned int temp = data & 0xff;             res.count = 0;    res.data = temp;        /* 循环判断每一位 */    for (int i = 0; i < 16; i++)    {        if (temp & 0x01)        {            res.count++;        }        temp >>= 1;    }        return res;}#else/* ============查表法============ */​int table[16] = {0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4};​struct test_res get_test_res(unsigned int data){    /* 保存测试结果 */    struct test_res res;        /* 保证数据总会在0~0xf之间 */    unsigned int temp = data & 0xff;             /* 获取低4位中1的个数 */    unsigned int low_data = temp & 0xf;    unsigned int low_cnt = table[low_data];        /* 获取高4位中1的个数 */    unsigned int high_data = (temp >> 4) & 0xf;    unsigned int high_cnt = table[high_data];        /* 结果 */    res.count = low_cnt + high_cnt;    res.data = temp;        return res;}#endifint main(void){  /* USER CODE BEGIN 1 */  struct test_res res = {0};      /* 省略部分代码。。。。。。。。。 */      while (1)  {  /* USER CODE END WHILE */  /* USER CODE BEGIN 3 */    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_SET);    res = get_test_res(30);    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_RESET);  }  /* USER CODE END 3 */}

常规法程序的运行时间:

052dbfd1fe4b1391af6a640566a0da34.png

查表法程序的运行时间:

a93c4fe21e21f53d72122bae75c5dbe8.png

可见,这个例子中常规法程序运行时间约为2ns,而查表法程序运行时间约为500ns。查表法的程序运行之间仅为常规法的1/4,省下了3/4的时间。随着调用次数的增多,这里的查表法的优势越大。比如循环计算0~31这32个数中每一个数二进制位为1的个数,则相关代码改为:

  int i;  while (1)  {    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_SET);    for (i = 0; i < 32; i++)    {      res = get_test_res(i);    }    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_RESET);  }

常规法:

6c74dd0a8642c5f056b23a5b68003f0d.png

查表法:

cdaeb15dcd8fc947d1e4c8614b092b42.png

可见,随着调用次数的增多,查表法相对于常规法更省时,即查表法的优势越大。

以上就是关于GPIO+逻辑分析仪测程序运行时间的几个实例。下面顺带提一下使用MDK+ST-LINK测STM32程序运行时间的方法。

MDK+ST-LINK测时间

在使用MDK作为开发工具时,可以搭配一些仿真器来查看程序执行时间。这里通过实例来介绍MDK+ST-LINK测STM32程序运行时间的方法。

b5c06bfc1ad861df90e04146a52b113c.png
4ccfae4f6c204fecc59d25a0dbb39021.png

这里重点是设置Trace里面的系统内核时钟,我们这里使用的是小熊派开发板(主控:STM32L431RCT6),并且配置的系统时钟是80MHz:

794207b5088b252ae9ea5ba517d430e0.png

所以在Trace中要设置为80MHz。这个得根据实际芯片的型号就需要根据进行修改,比如STM32F103系列默认是72MHz,STM32F429系列默认为180MHz等,根据实际进行修改。

下面我们通过在线调试、打断点的方式看一下 HAL_Delay(1000);运行了多长时间:

81a08a93d85dcfa655723a08f979a22c.png
e9c056a23c0fea20b8b8d7abe5498988.png

可见程序运行到HAL_Delay(1000);前后的时间分别为:

前:0.00008964s后:1.00108161s

即HAL_Delay(1000);走过的时间约为1s,符合预期。


以上就是本次的分享,如有错误,欢迎指出!感谢阅读

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值