【妙】bug称它为"数组越界的妙用"

1、聊一聊

    

    首先跟大家推荐一首非常温柔的歌曲,跑步的常听。

    本文主要把自己对C语言中柔性数组、零数组等等的理解分享给大家,并聊聊如何构建一种统一化的学习思想。

2、正文部分

1

抽象与归纳

拥有多年开发经验的工程师们,除了个别人技术上老是在吃老本而止步现状的落后以外,大部分技术水平都差不多。

这些经验老道的攻城狮们,通常对待疑难杂症都有一套经常使用的解决方案,这也是为什么对于一些常规的设计他们能够信手拈来的原因。

然而这些解决方案虽然最终都能解决问题,但却存在时间、实施难度等方面的差异,往往这样的差异就被大家拿来作为技术水平高低的评价。

这些差异到底是什么导致的呢?个人觉得还是对问题的本质抽象和问题归纳能力存在一些差别。

所以今天bug菌把数组越界、柔性数组、零数组等这些概念统一起来,对一件事物不同的理解角度会收获不一样的知识。

2

把脉"奇怪"数组

1

零数组与柔性数组

大家有时候看一些开源的代码特别是Linux源码中会发现一些"奇怪"的数组定义,如array[0],array[]等等,他们一般位于结构体的末尾来定义使用,用变长数组在网络通信中构造不定长数据包,如下代码所示。

struct _tag_Pack {
    uint16_t type;
    uint16_t len;
    uint8_t  data[0];
} __attribute ((packed));

其实对于0数据的使用在标准的C语言中是非法的,当然目前最新的C标准应该有这一块的支持,至少bug菌在VS2019上它只报了一个警告。

而柔性数组是C99标准中支持的,即array[]形式,而零数组主要是GUNC中的扩展语法,当然对于目前非常多的编译器已经兼容了这一块,所以在相关开源代码中是非常常见的,一些朋友首次看到可能迷迷糊糊,或者有些妙招还没有get到,就好好看看下面bug菌唠的嗑。

2

经典实例

代码已为你准备好了:

#include <stdio.h>
#include <stdlib.h>
 
typedef unsigned char uint8_t;
typedef unsigned short uint16_t;

//零数组 
struct _tag_Pack1 {
    uint16_t type;
    uint16_t len;
    uint8_t  data[0];
} __attribute ((packed));

//柔性数组C99支持 
struct _tag_Pack2 {
    uint16_t type;
    uint16_t len;
    uint8_t  data[];
} __attribute ((packed));

//数组长度为1 
struct _tag_Pack3 {
    uint16_t type;
    uint16_t len;
    uint8_t  data[1];
} __attribute ((packed));

//指针代替 
struct _tag_Pack4 {
    uint16_t type;
    uint16_t len;
    uint8_t  *data;
} __attribute ((packed));

int main(int argc, char *argv[]) {
 
 struct _tag_Pack1 *Pack1 = (struct _tag_Pack1*)malloc( sizeof(struct _tag_Pack1) + 10);
 struct _tag_Pack2 *Pack2 = (struct _tag_Pack2*)malloc( sizeof(struct _tag_Pack2) + 10);
 struct _tag_Pack3 *Pack3 = (struct _tag_Pack3*)malloc( sizeof(struct _tag_Pack3) + 10);
 struct _tag_Pack4 *Pack4 = (struct _tag_Pack4*)malloc( sizeof(struct _tag_Pack4)); 
 
 printf("Pack1 Size : %d\n",sizeof(struct _tag_Pack1));
 printf("Pack2 Size : %d\n",sizeof(struct _tag_Pack2));
 printf("Pack3 Size : %d\n",sizeof(struct _tag_Pack3));
 printf("Pack4 Size : %d\n",sizeof(struct _tag_Pack4));
 
 printf("Pack1 Offset : %ld\n", ((long)(Pack1->data ) - (long)(Pack1)));
 printf("Pack2 Offset : %ld\n", ((long)(Pack2->data ) - (long)(Pack2)));
 printf("Pack3 Offset : %ld\n", ((long)(Pack3->data ) - (long)(Pack3)));
 printf("Pack4 Offset : %ld\n", ((long)(&Pack4->data )- (long)(Pack4)));

 free(Pack1);
 free(Pack2);
 free(Pack3);
 free(Pack4);
 
 printf("最后一个bug\n");
 return 0;
}

运行结果如下

3

终极图解

如果经常使用此类方法应该很快就可以看懂了,如果没看懂,那就再来几张图:

1 ) 对于结构体类型Pack1和Pack2用法上几乎没什么差异,只是遵循的标准不同罢了,data[0]和data[]都不占据内存,你可以认为其仅仅只是一个地址常量罢了。

在GUNC标准中建议大家使用[0],而C99标准的VC编译环境中可以使用柔性数组方式[],这样移植性可能会更好一点。

2 ) 对于Pack3定义方式或许很多人初次见到,感觉没有太大的意义,无非就是在结构体最后使用了一个1byte的数组,其实这种形式通过浪费了一个byte却获得了代码非常好的兼容性,因为一些编译器并不支持零数组和柔性数组形式,而通过最后[1]的形式可以兼容各个标准和跨编译器,非常nice!

3)最后当然要谈到大伙最容易想到使用指针来代替数组了,这种形式先不说相对前面的结构体会浪费一个指针占据的空间,最重要的是无法通过一次malloc分配好所有内存,第一次malloc先为结构体成员分配内存,第二次malloc分配指针所指向的内存,并且两次malloc并不是在同一块连续的内存区域,容易造成较多内存碎片,而且释放内存还需要分别释放,我好累!

2

一切皆越界

数组越界应该是大伙最早出现且记忆犹新的bug了, C语言就是这么牛掰,可以说无论你想以怎样一种花式访问内存,C语言均可以实现,当然这把大刀你拿不动,却不老实想耍耍,一不小心就有可能砍伤自己。

而今天这几个看似奇奇怪怪的数组,我统一把他们理解为数组越界,并不需要你单独的去记忆每种数组如何的使用和分析。

我们再回到文章开头聊到工作多年水平的问题。

一个人的抽象和归纳能力的提升不仅仅需要多年的经验积累,更需要一个字 -- ”悟”。电影里面经常有这样的桥段,同样是拿到一本武功秘籍,却每个人练出来的境界各异。‘

刚参加工作的几年或许你能够到各类书本,培训机构等等,快速的提高自身的技术水准,因为在这个阶段是你技术知识匮乏的时候,知识的填充能够让你理解和认清楚很多的技术。

然而随着时间的推移,知识结构体系的完善,便会遇到技术的提升瓶颈,甚至感觉力不从心。

或许到了一个需要"悟"的阶段!

至于怎么去悟,bug菌也不知道,也或许就是坐下来认真思考吧!我相信也没有人能够说清楚,也正因为其没有方法可寻才愈发宝贵。

一旦学会了悟,便能够助你快速获取统一化的知识结构,并且从中获得更为高深的技术知识和解决方案,看问题也就会更加的清晰明朗!

3、结束语

    

    好了,本文到此结束!希望本文能够给你带来一些收获!

    我是bug菌,如果有所收获,记得点个赞再走!

推荐专辑  点击蓝色字体即可跳转

☞  MCU进阶专辑 

☞  嵌入式C语言进阶专辑 

☞  “bug说”专辑 

☞ 专辑|Linux应用程序编程大全

☞ 专辑|学点网络知识

☞ 专辑|手撕C语言

☞ 专辑|手撕C++语言

☞ 专辑|经验分享

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值