memcmp:
int memcmp(const void* buf1, const void* buf2, size_t num);
用于比较两个内存区域的内容。它的主要功能是按字节比较两个内存块,以确定它们是否相等,以及哪一个大于或小于另一个。
内存区域必须合法:确保buf1 和buf2指向的内存区域是合法的,并且足够大以包含 num
字节的数据。否则,会发生未定义的行为.
memcmp是按字节比较数据的,它不考虑数据的类型。这意味着它可以用于任何数据类型的比较,但需要注意确保数据类型和字节顺序的一致性。
不建议用于字符串比较:虽然memcmp可以用于字符串比较,但它不考虑字符串的终止符 \0
,因此不是最佳的字符串比较工具。通常,更适合字符串比较的函数是strcmp。
但怎么感觉memcmp不能比较数的大小,因为按字节比较,对于像整型这样的先比较完低位,如果低位比较出结果后面就不比高位了,比如如果按十进制来看,一个是101,一个是2 ,个位先比,2>1之后,直接返回一个小于零的数,后面的就不比了。这可能也是说它比较的是内存区域而不是数据大小的原因。
memset:
void* memset(void* ptr, int value, size_t num);
用于将内存块的一部分或全部字节设置为指定的值。它的功能是按字节设置内存块的内容。
ptr
:指向要设置的内存区域的指针。value
:要设置的值,通常是一个整数,但在函数内部会被强制转换为unsigned char
类型。num
:要设置的字节数。
memset
函数的作用是将 ptr
指向的内存区域的前 num
个字节都设置为 value
。通常,这个函数用于初始化数组或其他数据结构,或者用于清除内存块的内容。
内存区域必须合法:确保 ptr
指向的内存区域是合法的,并且足够大以包含 num
字节的数据。否则,会发生未定义的行为。
值的类型和范围:value
通常是一个整数,但在函数内部会被强制转换为 unsigned char
类型。请确保 value
的类型和范围适合用于填充内存块。
自定义类型:结构体,枚举,联合体
结构体:
//结构体的声明
struct tag
{
member-list;
}variable-list;
特殊声明:匿名结构体类型 -> 没有名字,只能用一次
匿名结构体类型
struct
{
学生的相关信息
char name[20];
int age;
}s1,a[40],*p;//定义的变量
结构体的自引用: (关于这一部分自己还是比较迷的)
使用指向自身的指针来定义一个链表结构,每个节点都包含一个指向下一个节点的指针。这种结构体的大小是可以计算的,编译器可以为其分配具体的内存。
struct Node
{
int data;
struct Node * next;
};
结构体重命名:
这里和上面的不一样的是上面的是定义了,但由于会无限循环导致大小不可计算,这里是使用时未定义。
//重命名的两种形式
//1
typedef struct Node
{
int data;
struct Node* next;
}* linklist;
//2
struct Node
{
int data;
struct Node* next;
};
typedef struct Node* linklist;
试了一下不用指针也可以。
结构体内存对齐:
对齐规则:
1、第一个成员在与结构体变量偏移量为0的地址处;
2、其他成员变量要对齐到对齐数的整数倍的地址处;
对齐数:编译器默认的一个对齐数与该成员大小的较小值,vs中默认的值为8,可以改。
3、结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍;
4、如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处(结构体所代表的对齐数,就是其内部成员变量的最大对齐数),结构体的整体大小就是所有最大对齐数(含嵌套结构体对齐数)的整数倍。
为什么存在内存偏移?
1、平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处去某些特定类型的数据,否则抛出硬件异常。
2、性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要做两次内存访问,而对齐的内容访问仅需要一次访问。总体来说,结构体的内存对齐是拿空间来换取时间的做法。
设计结构体时,尽可能让占用空间小的成员集中在一起以达到节省空间的目的。
———————————————————————————————————————————
这里的 s1 ,第一个成员是 c1,char类型,在结构体变量偏移量为0的地址处,而第二个成员 i 是 int 类型 , 其大小为4字节,和vs默认的对齐数 8 相比,4 更小,所有 i 变量的对齐数为 4,其所在的地址处应该是对齐数整数倍,这里 由于c1只占一个字节,后面1,2,3,4都是空的,所有 i 就会对齐到偏移量为 4 的地方,占 4,5,6,7四个字节,最后 c2 为char类型 ,1 字节,小于 8 ,所以 c2 会对齐到偏移量为 8 的地方 ,占第九个 字节,这里目前一共是占了 9 个字节 ,但结构体总大小应该是最大对齐数的整数倍,这里结构体成员的对齐数是 1, 4 ,1,最大对齐数为 4,又由于已经占了 9 个字节,所以应该再多占3个字节,总大小变成 12 个字节,4 的倍数。
offsetof:返回成员的偏移量。
修改默认对齐数:
#pragma
#pragma pack(num) 可以将对齐数改成num,注意后面没有分号
#pragma once 头文件中使用,作用是防止头文件被多次引用。
结构体传参:
首选传址调用,函数传参的时候,参数是需要压栈的,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。
位段:只能在结构体中使用
struct BitFieldExample {
type fieldName : width;
};
位段是C语言中的一种特殊数据类型,用于将数据存储在固定数量的位中。它们允许你在一个结构体或联合体中精确地控制数据的存储位数。位段通常用于节省内存或与硬件通信,因为它们可以精确地指定数据的位宽度,但是有跨平台的问题。
位段的声明和结构是类似的,但有两个不同:
1、位段的成员必须是 整型家族
2、位段的成员名后面有一个冒号和一个数字。数字表示分配几个比特位,但定义的比特位数不能大于其类型所拥有的比特位数
位段的内存分配:
1、位段的成员是整型家族的类型;
2、位段的空间是按照需要 以4个字节或者 1 个字节的方式来开辟的;
3、位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应避免使用位段。
内存如何分配使用,但这个只是在vs2022上测试的结果,其他编译器结果未必是这样。
位段的跨平台问题:
1、int位段被当成有符号数还是无符号数是不确定的;
2、位段中的最大位的数目(最多有多少位)不能确定;(16位机器最大16,32位机器最大32,如果在32位机器上定义的位数是27,那么在16位机器上就会出现问题)
3、位段中的成员在内存中从左向右分配,还是从右向左分配尚未定义;
4、当一个结构体包含两个位段,第二个位段成员比较大,无法容纳第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
———————————————————————————————————————————
枚举:enum,注意枚举常量后面的是逗号,而不是分号,最后一个量的后面没有符号。
枚举是一种用户定义的数据类型,用于表示一组有限的命名整数常量。枚举可以使代码更易读和维护,因为它们允许你为一组相关的常量分配有意义的名字,而不是使用硬编码的数字。
枚举常量在C语言中被视为整数类型。虽然枚举常量本身不必显式声明为整数类型(如int),但它们在内部被实现为整数常量。
enum EnumName {
EnumValue1,
EnumValue2,
/* ... */
EnumValueN
};
//enum EnumName 定义了一个枚举类型,EnumName 是枚举的名称。
//EnumValue1, EnumValue2, ..., EnumValueN 是枚举的成员(枚举常量)。这些成员是整数常量,按顺序分配值,从0开始递增。
这里编译器也越来越智能了,在我看的课里面整型是无法给Day类型赋值的,但这里就可以,甚至没有报错或者提醒。
enum的取值是默认从0开始的,一次递增1,也可以在定义的时候对其赋初值。
枚举的优点:
1、增加代码的可读性和可维护性;
2、和#define定义的标识符比较,枚举有类型检查,更加严谨;
define定义的常量是没有类型的,但枚举定义的有类型,如上面举例的,类型就是 Day。
3、防止了命名污染(封装);
(命名污染是指一个标识符(例如变量名、函数名、宏名等)在不同的作用域中具有相同的名称,但它们表示不同的实体或具有不同的含义。这可能会导致代码的混淆和错误,因为编译器或解释器可能无法正确地识别要引用的是哪个标识符,从而引发编译错误或运行时错误。)
4、便于调试,define定义的常量会在预处理阶段进行替换处理,将所有定义的名称替换成对应的数值或者文本,不方便阅读。
5、使用方便,一次可以定义多个常量。
——————————————————————————————————————————— 联合:union
联合(Union)是一种复合数据类型,类似于结构体(struct),但有一个关键区别:联合的成员共享同一块内存空间,而结构体的成员是独立分配的。
union UnionName {
member1Type member1Name;
member2Type member2Name;
/* ... */
};
//union UnionName 定义了一个联合类型,UnionName 是联合的名称。
//member1Type、member2Type 等是联合的成员的数据类型。
//member1Name、member2Name 等是联合的成员的名称。
与结构体不同,联合的所有成员共享同一块内存,其大小取决于最大成员的大小。这意味着在任何给定时刻,只有一个成员的值是有效的。因此,如果你改变了一个成员的值,其他成员的值也可能会受到影响。
之所以打印效果和下图一致,不仅和联合有关,和计算机的大小端存储有关
//判断大小端
//1、
int check_sys1(void)
{
char a = 1;
return a & ((char)1);
}
//2、
int check_sys2(void)
{
int a = 1;
return (char*)(&a);
}
//3、
int check_sys3(void)
{
union Un
{
char a;
int b;
}u;
u.b = 1;
return u.a;
}
int main()
{
int ret = check_sys1();
if (ret)
printf("小端存储\n");
else
printf("大端存储\n");
ret = check_sys2();
if (ret)
printf("小端存储\n");
else
printf("大端存储\n");
ret = check_sys3();
if (ret)
printf("小端存储\n");
else
printf("大端存储\n");
return 0;
}
联合大小的计算;
联合的大小至少是最大成员的大小;
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐最大对齐的整数倍。