目录
我们可以用类来定义新的类型,井且操纵这些新的类型可以像内置类型一样容易。通过创建新的类型来描述问题域,C++使程序员能够编写出更易于理解的应用程序。类设施使得程序员能够将新类型的底层实现相关细节(只有新类型的实现者才关心这些),同该类型的接口和操作的定义(该类型的用户需要这些信息)分离了。随着这种分离,程序设计中各种乏味的琐碎工作也就越来越不用关心了。应用程序的基本类型时以被实现一次,并被多次重用。将数据和函数封装在一起的这种设施。可以支持新类型的实现,也大大简化了应用程序后续的维护以及演化过程。 –
《C++Primer》
1.面向过程和面向对象初步认识
C语言是面向过程的,关注的是过程,分析出来解问题的步骤,通过函数调用逐步解决问题。
如下图的洗衣服:
需要按照如下步骤去完成
C++是基于面向对象的,关注的是对象,将一件事情拆分成不同的对象,靠对象之间的交互完成。
总共有四个对象:人,衣服,洗衣服,洗衣机
**整个洗衣服的过程:**人将衣服放入洗衣机、倒入洗衣粉、启动洗衣机,洗衣机就会完成整个洗一过程并甩干。
整个过程主要是:人、衣服、洗衣粉四个对象之间交互完成的,人不需要关心洗衣机具体是如何洗衣服的,是如何甩干的。
面向过程:关注的是需要洗衣服的每个步骤。体现在代码层面—方法/函数
面向对象:关注的是对象之间的关系,使用那个对象才能完成对应的功能,需要怎样合理利用对象可以得到洗衣服的结果。体现在代码层面—类的设计及类之间的关系
- 面向对象和面向过程都实现了洗衣服,但他们关注的点不同。
- 对于面向对象的理解,在我们学习和工作的不同时期会有不同的感触。刚接触时和学习使用一段时间后的感觉不同,使用一段时间和工作后在来看的感觉又有不同。这一知识点需要我们在使用中不断的感悟。
2.类的引入
C++中类可以用struct或class关键字来定义。
2.1使用struct定义类
在C语言中,我们只能使用struct在结构体中定义变量。
在C++中,兼容了C语言中struct的用法,同时使用struct定义的结构体升级为了类,其中不仅可以定义变量,也可以定义函数。同时可以直接使用类名来定义变量
如:下面的学生类
struct Student
{
//成员变量
char name[10];
int age;
int id;
//成员函数
void Init()//在成员方法里可以访问成员变量
{
strcpy(name, "张三");
age = 0;
id = 0;
}
void Print()
{
cout << name << endl;
cout << age << endl;
cout << id << endl;
}
};
int main()
{
Student s1; //升级为类,Student为类名,也是类型
struct Student s2 = { "李四",10,01 }; //兼容C
s1.Init();//初始化s1
s1.Print();//打印s1
s2.Print();//打印s2
return 0;
}
struct定义的类可以实现C语言中的所有功能,同时也可以实现C++中类的功能。
兼容struct的本质:使C代码可以在C++环境下完全可以运行,并且可以在struct结构体中修改与增加函数。
类中的变量和函数也有新的名字,如下:
成员变量:在类中定义的变量,又叫类的属性。
成员函数:在类中定义的函数,又叫类的方法。
类体:成员变量和成员函数的总称
- 名字只是代号,见的多了也就认识了。
- 在C++中,一般不使用struct来定义类,C++更喜欢用class来定义。
3.类的定义
C++除了struct还定义了它自己有关于类的关键字class
class Student
{
//类体:由成员变量和成员方法组成
}; //一定要注意后面的分号
使用class定义的类和struct定义的类相同,即可以定义函数也可以定义变量。
3.1类的两种定义方式:
-
成员函数的声明和定义全部放在类体中。
需注意:成员函数如果在类中定义,编译器可能会将其当成内联函数处理。
-
类声明放在
.h
文件中,成员函数定义放在.cpp
文件中。注意:成员函数名前需要加
类名::
- 一般情况下,更期望采用第二种方式。将声明和定义分离,一般项目的代码量都不会少,第二种方法更有效于项目的开发。
- 注意: 声明和定义分开,成员函数中是要缺省参数时,需要将缺省参数写在声明里
3.2成员变量命名规则的建议
// 我们看看这个函数,是不是很僵硬?
class Date
{
public:
void Init(int year)
{
// 这里的year到底是成员变量,还是函数形参?
year = year;
}
private:
int year;
};
这样写是错误的,编译器无法判断两个变量year的区别,我们在测试中观察:
- 如上图,运行了成员函数后成员变量的值仍然是随机值,证明编译器无法识别这两个相同的变量
所以我们一般都这样定义成员变量
class Date
{
public:
void Init(int year)
{
_year = year;
}
private:
int _year;
};
// 或者这样
class Date
{
public:
void Init(int year)
{
mYear = year;
}
private:
int mYear;
};
- 采用其他方法也可以,主要看公司要求,一般都是加个前缀或者后缀标识区分就行。
即使之后学习了
this
,也要使用这种方法区分成员变量和形参。
- 我们不能保证每次this都使用并使用正确
- 当把两种变量在命名时区分开后,更有利于我们或其他人编写、查看、调试代码,这是很好的编程习惯,不给未来的维护留下隐患。
拓展:
我们可以采用类型+作用域的形式来区分成员变量和形参,但不建议使用,这样写有些繁琐,得不偿失,这里只做了解,如下:
class Date
{
public:
void Init(int year)
{
Date::year = year;
}
private:
int year;
};
3.3成员函数与成员变量定义的位置建议
个人认为,这块内容,各位读者只做个参考,跳过也是可以的,并无大碍。
各位如果看过不少的C++代码,应该会发现,有人习惯把成员变量的定义写在成员函数的前面,有人习惯写在后面,这两种写法都有它们自己的一套说法,我在这里简绍一二。
C语言编译器寻找变量,先在所需要使用变量的前面去找,然后是在全局中找,所以C语言中变量一般定义在前面。C++编译器不是这样,因为有类的存在,编译器会将类看作一个整体,先在类中找寻变量,之后在全局这寻找。
这就使得在类中,我们可以将成员变量定义在成员函数得后面。那我们该怎样定义呢?
在《高质量C/C++编程》中将成员函数与成员变量在类中定义的位置分为两种,并做出了推荐使用那种方式:
-
将private类型的数据写在前面,而将public类型的函数写在后面,采用这种版本的程序员主张类的设计“
以数据为中心
”,重点关注的内部结构。class A { private: int i, j; float x, y; public: void Func1(void); void Finc2(void); };
-
将public类型的函数写在前面,而将private类型的数据写在后面,采用这种版本的程序员主张类的设计“
以行为为中心
”,重点关注的是类应该提供什么样的接口(或服务)。class B { public: void Func1(void); void Finc2(void); private: int i, j; float x, y; };
很多C++的教科书采用“
以数据为中心
”的书写方式,在《高质量C/C++编程》中并不推荐,更建议用"以行为为中心
"的书写方式。理由: 这样做不仅让自己在设计类时思考清晰,而且方便别人阅读。因为用户最关心的是接口,谁愿意先看到一堆私有数据成员!
4.类的访问限定符及封装
4.1访问限定符
C++实现封装的方式:用类将对象的属性和方法结合在一起,让对象更加完善,通过访问权限选择性的将其接口提供给外部的用户使用。
访问权限符说明
- public修饰的成员在类外可以直接被访问。
- protected和private修饰的成员在类外不能直接被访问(此处protected和private是类似的,在后面的继承这是有区别的)
- 访问权限作用域从该访问限定符出现的位置开始一直到下一个访问限定符出现为止。
- 如果后面没有访问限定符,作用域就到
}
即类结束。 - class的默认访问权限为private,struct为public(因为struct要兼容C)
- 一般在定义类的时候,尽量不要用class/struct默认的访问限定符,要明确定义范围限定符
访问限定符的存在使得用户不能直接修改类中得成员变量,只能提供我们提供得接口,让类中得数据更加安全,也让用户使用类的方式更加规范。
注意:
- 访问限定符只在编程时有用,当数据映射到内存后,没有任何访问限定符上的区别。
- 访问限定符限定的只是类外的访问权限,类内可以随意修改。
【面试题】
问题:C++中struct和class的区别是什么?
C++需要兼容C语言,所以C++中struct可以当成结构体使用。另外C++中struct还可以用来定义类。和class定义类是一样的,区别是struct定义的类默认访问权限是public,class定义的类默认访问权限是private。
注意:在继承和模板参数列表位置,struct和class也有区别,后序给大家介绍。
4.2封装
面向对象的三大特征:封装、继承、多态。
在类和对象阶段,主要是研究类的封装特性,那么什么是封装呢?
封装:将数据和操作数据的方法进行有机结合,隐藏对象的属性和实现细节,仅对外公开接口来和对象进行交互。
封装本质是一种管理,让用户更方便使用类。
封装是一种更好的严格管理,不封装是一种自由管理。
如下面栈的类
将栈的所有内容放在一起进行封装管理,只允许去调用public下的接口,而不能直接调用它的属性。
像是我们编写一个栈,实现它的取栈顶操作,在C语言中可以直接调用top,而不用调用Top接口,这就十分危险,因为我们不知道top是如何定义的是否需要做处理,而封装后,无法直接调用属性,使之变得更加安全。
- 数据和方法都封装在类里面
- 可以给你访问的定义成公有,不想给你访问的定义为私有或保护
比如:对于电脑这样一个复杂的设备,提供给用户的就只有开关机键、通过键盘输入,显示器,USB插孔等,让用户和计算机进行交互,完成日常事务。但实际上电脑真正工作的却是CPU、显卡、内存等一些硬件元件。
对于计算机使用者而言,不用关心内部核心部件,比如主板上线路是如何布局的,CPU内部是如何设计的等,用户只需知道,怎么开机、怎么通过键盘和鼠标与计算机进行交互即可。因此计算机厂商在出厂时,在外部套上壳子,将内部实现细节隐藏起来,仅仅对外提供开关机、鼠标以及键盘插孔等,让用户可以与计算机进行交互即可。
在C++语言中实现封装,可以通过类将数据以及操作数据的方法进行有机结合,通过访问权限来隐藏对象内部实现细节,控制哪些方法可以在类外部直接被使用。
注意:
编译器一般会直接将定义在类中的函数看作内联函数处理,因为一般在类中定义的函数都是比较小的,而在类中声明在类外定义的函数则都比较打,所以编译器这样处理。
5.类的作用域
类定义了一个新的作用域,类的所有成员都在类的作用域中。在类体外定义成员时,需要使用 ::
作用域操作符指明成员属于哪个类域。
class Stack
{
private:
int* arr;
int top;
int capacity;
public:
void Init();
int Top();
//...
};
//需要指点两个函数是那个类的
void Stack::Init()
{
arr = nullptr;
top = capacity = 0;
}
int Stack::Top()
{
assert(top > 0);
return top - 1;
}
c++兼容C,可以定义全局的函数,在类外定义函数时需要指点是那个类的,Java只能在类中定义函数。
注意:
类域不同于命名空间域,命名空间中虽然我们也可以定义函数和变量,但其中的函数放在了栈中,变量也分配了对应的空间。类中的成员变量只有在实例化后才会分配空间,类中的成员函数不是存在栈中,而是放在了一个公共代码区(下面会讲)。
6.类的实例化
用类类型创建对象的过程,称为类的实例化
-
类是对对象进行描述的,是一个模型一样的东西,限定了类有那些成员,定义出一个类并没有分配实际的内存空间来存储它;
类就像谜语一样,对谜底进行描述,谜底就是谜语的一个实例。
谜语:“年纪不大,胡子一把,主人来了,就叫妈妈” 谜语:山羊
-
一个类可以实例化出多个对象,实例化出的对象,占用实际的物理空间,存储类成员变量。
Person类是没有空间的,只有Person类实例化出的对象才有具体的年龄
-
做一个比方。类实例化出对象就像现实中使用建筑设计图建造房子,类就像是设计图,只设计出需要什么东西,但是并没有实体的建筑存在,同样类也只是一个设计,实例化出的对象才能实际存储数据,占用物理空间。
- 注意: 与C语言不同,C++中不能使用一个char类型的指针去接收一个字符串,可以将字符串放在数组中如何由指针接收
7.类对象模型
7.1如何计算类对象的大小
class Student
{
public:
char* _name; //姓名
char* _sex; //性别
int _age; //年龄
public:
void showInfo(); //显示基本信息
};
问题:类中既可以有成员变量,又可以有成员函数,那么一个类的对象中包含了什么?如何计算一个类的大小?
7.2类对象的存储方式猜测
-
对象中包含类的各个成员
缺陷:每个对象中成员变量是不同的,但是调用同一份函数(相同的类创建多个对象,每个对象的成员变量可能是不同的,而成员函数是相同的不会被改变),如果按照此种方式存储,当一个类创建多个对象时,每个对象中都会保存一份代码,相同代码保存多次,浪费空间。那么如何解决这个问题?
-
代码只保存一份,在对象中保存存放代码的地址
解决了第一种存储方式的缺陷,将原本的函数改为地址,减小了对象所占的空间。当需要使用函数时,根据地址,调用函数。这样做不同的对象调用的就是相同地址的函数,因为函数在调用时都是使用同样的方式编写的,没必要浪费空间,对每个对象开辟多余的空间存放成员函数。 -
只保存成员变量,成员函数存放在公共的代码段
生成的对象中成员函数的地址也不在存储,将成员函数存放在公共代码区,生成的对象调用的函数也是相同的。
实际上,这种方法,成员函数经过编译后形成的指令是由编译器放置到公共代码段中去的,编译器在调用该函数时也能轻松的找到该指令,并不会与其他的成员函数生成的指令混肴。
问题:对于上述三种存储方式,那计算机到底是按照那种方式存储的?
我们通过对下面的不同对象分别获取大小来分析看一下
class A1
{
private:
int _a;
int _b;
int* _c;
public:
void Init();
};
class A2
{
public:
void Init();
};
class A3
{};
int main()
{
printf("sizeof(A1):%d\n", sizeof(A1));
printf("sizeof(A2):%d\n", sizeof(A2));
printf("sizeof(A3):%d\n", sizeof(A3));
return 0;
}
由上面的结果可以看出,计算类的大小时,只计算了它的“成员变量”的和。
结论:计算机采用第三种存储方式,一个类的大小,实际就是该类中“成员变量”之和,当然要注意内存对齐(与结构体内存对齐相同)。
那为什么空类实例化的对象大小为1呢?
首先,我们使用类实例化了一个对象,哪怕这个类什么都没有是个空类,但它的对象一定是存在的,并且分配了地址来存储这个对象(我们上面已经说了一个对象不存储它自己的成员函数,A2看作空类)
A2 aa;
A3 bb;
printf("%p\n", &aa);
printf("%p\n", &bb);
所以为了区分和存储这样的对象,编译器会给出一字节,这一字节不存储有效数据,只是为了占位,表示对象存在。
7.3对象私有成员的访问范围
我们已经知道一个类中可以将自己的成员变量使用private修饰,使只无法在类外访问,这里结合成员函数存在公共区域讲一个现象。
一个对象调用成员函数,参数为同类的其他对象,在成员函数内其他对象可以访问自己的成员变量,代码如下
class Date
{
public:
void Print(Date d)
{
cout << d._day << " " << d._month << " " << d._year << endl;
}
void Init(int year, int month, int day)
{
_year = year;
_month = month;
_day = day;
}
private:
int _year;
int _month;
int _day;
};
int main()
{
Date today1;
Date today2;
today1.Init(2023, 2, 5);
today2.Init(2023, 2, 4);
today1.Print(today2);
return 0;
}
- 因为成员函数在公共区域,不算是在类外,可以访问
注意: 只有一个类创造出的对象可以
7.4结构体内存对齐规则
我们已经知道了类对象的存储方式之后,就需要计算一个对象的大小。类是由结构体演化而来,并且对象中并不存储成员函数,那对象的大小的计算方式与结构体大小的计算方式可以说是一模一样,我们就必须要知道结构体的对齐规则。(更具体的内容可查看该篇博客结构体进阶)
规则如下:
-
第一个成员在与结构体偏移量为0的地址处。
-
其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
注意:对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值
VS默认的对齐数为8,Linux下没有默认对齐数
-
结构体总大小为:最大对齐数(所有变量类型最大者与默认对齐参数取最小)的整数倍。
-
如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
【面试题】
-
结构体怎么对齐?为什么要进行结构体对齐?
对齐规则如上,为什么要进行结构体对齐官方没有给出原因,大多数参考书给出的原因如下:
-
平台原因(移至原因)
不是所有的平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些特点的地址处存储特点类型的数据,否则会抛出异常。
比如因为硬件的原因当我们要定义一个整型的变量时,要求它必须存储在偏移量为4的倍数的位置,这样它的对齐数就只能是4.(基于一些特殊的平台)
-
性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
为了访问未对其的内存,处理器需要作两次访问;而对齐的内存仅需要一次访问。
由于CPU和数据存储方式的原因,当一个整数,放在偏移量为1的位置上时,CPU需要访问两次,才能完全取出数据。大家要是对这个原理感兴趣,可以看一总结的这篇博客 探索未对齐内存CPU的访问逻辑
-
-
如何让结构体按照指定的对齐数参数进行对齐?能否按照3、4、5即任意字节对齐?
需要使用
#pragma pack()
来改变默认对齐数- 设置默认对齐数:#pragma pack() —— 括号内设默认对齐数的值,值为整数,不能为空
- 回复默认对齐数:#pragma pack() —— 括号内什么都不写
#pragma pack(3)//设置默认对齐数为3 struct S1 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 #pragma pack(4)//设置默认对齐数为4 struct S2 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 #pragma pack(5)//设置默认对齐数为5 struct S3 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 #pragma pack(1)//设置默认对齐数为1 struct S4 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 int main() { //输出的结果是什么? printf("%d\n", sizeof(struct S1)); printf("%d\n", sizeof(struct S2)); printf("%d\n", sizeof(struct S3)); printf("%d\n", sizeof(struct S4)); return 0; }
-
什么是大小端?如何测试某台机器是大端还是小端?有没有遇到过要考虑大小端的场景
小端:创建一个变量并赋值,它的高位存在高地址处,低位存在低地址处
大端:创建一个变量并赋值,它的高位存在低地址处,低位存在高地址处
-
指针强转
int CheckSys() { int a = 1; return (*(char*)&a);//将int型变量强转为char,转化后的值为首地址的值 } int main() { int ret = CheckSys(); if (ret) cout << "小端" << endl; else cout << "大端" << endl; return 0; }
-
联合体
union CheckSys { //定义两个变量,这两个共用同一块内存,两变量的大小不同,但首地址相同 int a; char ch; }; int main() { CheckSys test; test.a = 1; if (test.ch) cout << "小端" << endl; else cout << "大端" << endl; return 0; }
-
8.this指针
8.1this指针的引出
我们先来定义一个日期类Date
class Date
{
private:
int _year; // 年
int _month; // 月
int _day; // 日
public:
void Init(int year,int month,int day)
{
_year = year;
_month = month;
_day = day;
}
void Print()
{
cout << _year << "-" << _month << "-" << _day << endl;
}
};
int main()
{
Date d1, d2;
d1.Init(2023, 1, 13);
d2.Init(2023, 1, 14);
d1.Print();
d2.Print();
return 0;
}
对于上述类,有这样一个问题:
Date类中有 Init 和 Print 两个成员函数,函数体中没有关于不同对象的区分,那当d1调用 Init 函数时,该函数是如何知道应该设置d1对象,而不是设置d2对象呢?
虽然调用函数时的对象不同,但函数内部的成员变量名一样,而且成员函数存在公共区域,函数内没有任何对象的出现,为什么一个对象调用函数后在函数内使用的是自己的成员变量而不是其他对象的?
C++中通过引入this指针来解决该问题,即:C++编译器给每个“非静态的成员函数”增加了一个隐秘的指针参数this
,让该指针指向当前对象(函数运行时调用该函数的对象),在函数体中所有“成员变量”的操作,都是通过该指针区去访问。只不过所有的操作对用户都是透明的,即用户不需要传递(也不能传递),编译器自动完成。
8.2this指针的特性
- this指针的类型:
类类型* const this
,const在类类型后,即成员函数中,不能给this指针赋值。 - 只能在”成员函数“的内部使用
- this指针本质上是”成员函数“的形参,当对象调用成员函数时,将对象地址作为实参传递给this形参。所以对象中不存储this指针。
- this指针是”成员函数“第一个隐含的指针形参,一般情况由编译器通过ecx寄存器自动传递,不需要用户传递。
- 我们已经知道,this指针是在我们调用成员函数时,编译器帮我们默认加入了,所以一般C++用的多的人,不会在成员函数内显示this指针了
【面试题】
-
this指针存在哪里?
一般情况下是在栈中,因为this是形参,形参是在栈帧中。
有些编译器会将它放在寄存器中,因为this指针经常使用,寄存器的速度恒快可以满足它。如:VS 2013、VS 2019
-
this指针可以为空吗?
测试1:
//1.下面的程序编译结果是?A.编译报错 B.运行崩溃 C.正常运行 class Test { private: int _a; public: void Print() { cout << "Print()" << endl; } }; int main() { Test* p = nullptr; p->Print(); return 0; }
测试2:
//2.下面的程序编译结果是?A.编译报错 B.运行崩溃 C.正常运行 class Test { private: int _a; public: void Print() { cout << _a << endl; } }; int main() { Test* p = nullptr; p->Print(); return 0; }
测试2:
//3.下面的程序编译结果是?A.编译报错 B.运行崩溃 C.正常运行 class Test { private: int _a; public: void Print() { cout << "Print()" << endl; } }; int main() { Test* p = nullptr; (*p).Print(); return 0; }
编译错误:编译器报出语法错误
分析:
- p是空指针,但p调用成员函数不会编译报错,因为空指针不是语法错误,编译器检查不出来。
- p调用成员函数不会出现空指针访问,因为成员函数没有存在对象里,存在公共的空间里。
- p作为实参传递给隐藏this指针,空指针作为实参传递是完全可以的,传递后this也是空指针。
测试1中,在成员函数内没有用到空指针,正常运行。
测试2中,在成员函数内,this指针调用了成员变量,在该成员函数内调用成员变量,该成员变量是属于指针p的,它为空,在成员函数内调用成员变量会使用隐藏的this指针,此时的this指针为空,这明显是错误的,运行崩溃。
测试3中,指针的作用是,接收同类型变量的地址,虽然我们对p解引用了,但解引用后,空指针仍然是Test类型,可以调用该类公共区域的成员函数,在该函数内,未对空指针解引用,没有用到空指针p,正常运行。
我们在来以汇编的角度观察一下这测试程序:
- 从上图我们可以看出这两行代码的汇编指令相同,那这三个测试程序的区别就在于,是否在对象为空指针的情况下在成员函数内调用成员变量了。
所以,this指针可以为空,但在调用成员函数后,不用在函数内调用成员变量,这会会调用this(此时为空),而空指针无法调用自身的成员变量,造成运行崩溃。