有时需要将不同类型的数据组合成一个有机的整体,以供用户方便地使用。这些组合在一个整体中的数据是互相联系的。例如,一个学生的学号、姓名、性别、年龄、成绩、家庭地址等项,都是这个学生的属性。
在一个组合项中包含若干个类型不同(当然也可以相同)的数据项。C和C++允许用户自己指定这样一种数据类型,它称为结构体。它相当于其他高级语言中的记录(record)。例如,可以通过下面的声明来建立如图7.1所示的数据类型。
struct Student//声明一个结构体类型Student
{
int num;//包括一个整型变量num
char name[20];//包括一个字符数组name,可以容纳20个字符
char sex;//包括一个字符变量sex
int age;//包括一个整型变量age
float score;//包括一个单精度型变量
char addr[30];//包括一个字符数组addr,可以容纳30个字符
};//最后有一个分号
这样,程序设计者就声明了一个新的结构体类型Student(struct是声明结构体类型时所必须使用的关键字,不能省略),它向编译系统声明: 这是一种结构体类型,它包括num, name, sex, age, score, addr等不同类型的数据项。应当说明Student是一个类型名,它和系统提供的标准类型(如int、char、float、double 一样,都可以用来定义变量,只不过结构体类型需要事先由用户自己声明而已。
声明一个结构体类型的一般形式为
struct 结构体类型名{成员表列};
结构体类型名用来作结构体类型的标志。上面的声明中Student就是结构体类型名。大括号内是该结构体中的全部成员(member),由它们组成一个特定的结构体。上例中的num,name,sex,score等都是结构体中的成员。 在声明一个结构体类型时必须对各成员都进行类型声明即类型名 成员名;每一个成员也称为结构体中的一个域(field)。成员表列又称为域表。
声明结构体类型的位置一般在文件的开头,在所有函数(包括main函数)之前,以便本文件中所有的函数都能利用它来定义变量。当然也可以在函数中声明结构体类型。
在C语言中,结构体的成员只能是数据(如上面例子中所表示的那样)。C++对此加以扩充,结构体的成员既可以包括数据(即数据成员),又可以包括函数(即函数成员),以适应面向对象的程序设计。
但是由于C++提供了类(class )类型,一般情况下,不必使用带函数的结构体,因此在本章中只介绍只含数据成员的结构体,有关包含函数成员的结构体将在第8章介绍类类型时一并介绍。
以上只是指定了一种结构体类型,它相当于一个模型,但其中并无具体数据,系统也不为之分配实际的内存单元为了能在程序中使用结构体类型的数据,应当定义结构体类型的变量,并在其中存放具体的数据。
定义结构体类型变量的方法可以采取以下3种方法定义结构体类型的变量。
- 先声明结构体类型再定义变量名如上面已定义了一个结构体类型Student,可以用它来定义结构体变量。如
Student student1, student2;
以上定义了student1和student2为结构体类型Student的变量,即它们具有Student类型的结构。如图7.2所示。图7.2 在定义了结构体变量后,系统会为之分配内存单元。例如student1和student2在内存中各占63个字节
(4+20+1+4+4+30=63)。 - 在声明类型的同时定义变量
例如:
struct Student//声明结构体类型Student
{
int num;
char name[20];
char sex;
int age;
float score;
char addr[30];
}student1,student2;//定义两个结构体类型Student的变量student1,student2
这种形式的定义的一般形式为:
struct 结构体名
{
成员表列
}变量名表列;
- 直接定义结构体类型变量
其一般形式为
struct//注意没有结构体类型名
{
成员表列
} 变量名表列;
这种方法虽然合法,但很少使用。提倡先定义类型后定义变量的第(1)种方法。
关于结构体类型,有几点要说明:
- (
- 不要误认为凡是结构体类型都有相同的结构。实际上,每一种结构体类型都有自己的结构,可以定义出许多种具体的结构体类型。
- 类型与变量是不同的概念,不要混淆。只能对结构体变量中的成员赋值,而不能对结构体类型赋值。在编译时,是不会为类型分配空间的,只为变量分配空间。
- 对结构体中的成员(即“域”),可以单独使用,它的作用与地位相当于普通变量。关于对成员的引用方法见7.3节。
- 成员也可以是一个结构体变量。如:
struct Date //声明一个结构体类型Date
{
int month;
int day;
int year;
};
struct Student
//声明一个结构体类型Student
{
int num;
char name[20];
char sex;
int age;
Date birthday;
char addr[30];
}student1,student2;
//定义student1和student2为结构体类型Student的变量Student的结构见图7.3所示。图7.3
- 结构体中的成员名可以与程序中的变量名相同,但二者没有关系。例如,程序中可以另定义一个整型变量num,它与student中的num是两回事,互不影响。
结构体变量的初始化
和其他类型变量一样,对结构体变量可以在定义时指定初始值。如
struct Student
{
int num;
char name[20];
char sex;
int age;
float score;
char addr[30];
}student1={10001,"Zhang Xin",'M',19,90.5,"Shanghai"};
这样,变量student1中的数据如图7.2中所示。也可以采取声明类型与定义变量分开的形式,在定义变量时进行初始化:
student2= student1;
在定义了结构体变量以后,当然可以引用这个变量。常用的方法有以下几种:
- 可以将一个结构体变量的值赋给另一个具有相同结构的结构体变量。
如上面的student1和student2都是student类型的变量,可以这样赋值:
student1= student2; - 可以引用一个结构体变量中的一个成员的值。
例如, student1.num表示结构体变量student1中的成员的值,如果student1的值如图7.2所示,则student1.num的值为10001。
引用结构体变量中成员的一般方式为
结构体变量名.成员名
例如可以这样对变量的成员赋值:
student1.num=10010; - 如果成员本身也是一个结构体类型,则要用若干个成员运算符,一级一级地找到最低一级的成员。
例如,对上面定义的结构体变量student1, 可以这样访问各成员:
student1.num (引用结构体变量student1中的num成员)
如果想引用student1变量中的birthday成员中的month成员,不能写成student1.month,必须逐级引用,即
student1.birthday.month=12;(引用结构体变量student1中的birthday成员中的month成员) - 不能将一个结构体变量作为一个整体进行输入和输出。
例如,已定义student1和student2为结构体变量,并且它们已有值。不能企图这样输出结构体变量中的各成员的值:
cin>>student1;
只能对结构体变量中的各个成员分别进行输入和输出。 - 对结构体变量的成员可以像普通变量一样进行各种运算(根据其类型决定可以进行的运算种类)。例如
student2.score=student1.score;
sum=student1.score+student2.score;
student1.age++;
++student1.age;
由于“.”运算符的优先级最高,student1.age++相当于(student1.age)++ 。++是对student1.age进行自加运算,而不是先对age进行自加运算。 - 可以引用结构体变量成员的地址,也可以引用结构体变量的地址。如
cout<<&student1;//输出student1的首地址
cout<<&student1.age;//输出student1.age的地址
结构体变量的地址主要用作函数参数,将结构体变量的地址传递给形参。
例7.1 引用结构体变量中的成员。
#include <iostream>
using namespace std;
struct Date//声明结构体类型Date
{
int month;
int day;
int year;
};
struct Student//声明结构体类型Student
{
int num;
char name[20];
char sex;
Date birthday;//声明birthday为Date类型的成员
float score;
}student1,student2={10002,″Wang Li″,′f′,5,23,1982,89.5};
//定义Student 类型的变量student1,student2,并对student2初始化
int main( )
{
student1=student2;//将student2各成员的值赋予student1的相应成员
cout<<student1.num<<endl;//输出student1中的num成员的值
cout<<student1.name<<endl;//输出student1中的name成员的值
cout<<student1.sex<<endl;//输出student1中的sex成员的值cout<<student1.birthday.month<<′/′<<student1.birthday.day<<′/′ <<student1.birthday.year<<endl;//输出student1中的birthday各成员的值
cout<<student1.score<<endl;
return 0;
}
运行结果如下:
10002 Wang Li f 5/23/1982 89.5 7.1.4
1. 定义结构体数组和定义结构体变量的方法相仿,定义结构体数组时只需声明其为数组即可。如
struct Student//声明结构体类型Student
{
int num;
char name[20];
char sex;
int age;
float score;
char addr[30];
};
Student stu[3];//定义Student类型的数组stu也可以直接定义一个结构体数组,如
struct Student
{
int num;
char name[20];
char sex;
int age;
float score;
char addr[30];
}stu[3];
或
struct
{
int num;
char name[20];
char sex;
int age;
float score;
char addr[30];
}stu[3];
结构体数组的初始化与其他类型的数组一样,对结构体数组可以初始化。如
struct Student
{
int num;
char name[20];
char sex;
int age;
float score;
char addr[30];
}stu[3]={
{10101,″Li Lin″, ′M′, 18,87.5, ″103 Beijing Road″},
{10102,″Zhang Fun″,′M′,19,99, ″130 Shanghai Road″},
{10104,″Wang Min″,′F′, 20,78.5, ″1010 Zhongshan Road″}
};
定义数组stu时,也可以不指定元素个数,即写成以下形式:
stu[ ]={{…},{…},{…}};
编译时,系统会根据给出初值的结构体常量的个数来确定数组元素的个数。
一个结构体常量应包括结构体中全部成员的值。当然,数组的初始化也可以用以下形式:
Student stu[ ]={{…},{…},{…}};//已事先声明了结构体类型Student
由上可以看到,结构体数组初始化的一般形式是在所定义的数组名的后面加上 ={初值表列};
2. 结构体数组应用举例
下面举一个简单的例子来说明结构体数组的定义和引用。
例7.2对候选人得票的统计程序。设有3个候选人,最终只能有1人当选为领导。今有10个人参加投票,从键盘先后输入这10个人所投的候选人的名字,要求最后输出这3个候选人的得票结果。可以定义一个候选人结构体数组,包括3个元素,在每个元素中存放有关的数据。程序如下:
#include <iostream>
struct Person//声明结构体类型Person
{
char name[20];
int count;
};
int main( )
{
Person leader[3]={″Li″,0,″Zhang″,0,″Fun″,0};//定义Person类型的数组,内容为3个候选人的姓名和当前的得票数
int i,j;
char leader_name[20];//leader_name为投票人所选的人的姓名
for(i=0;i<10;i++)
{
cin>>leader_name;//先后输入10张票上所写的姓名
for(j=0;j<3;j++)//将票上姓名与3个候选人的姓名比较
if(strcmp(leader_name,leader[j].name)==0) leader[j].count++;
//如果与某一候选人的姓名相同,就给他加一票
}
cout<<endl;
for(i=0;i<3;i++)//输出3个候选人的姓名与最后得票数
{
cout<<leader[i].name<<″:″<<leader[i].count<<endl;
}
return 0;
}
运行情况如下:
Zhang↙ (每次输入一个候选人的姓名)
Li↙
Fun↙
Li↙
Zhang↙
Li↙
Zhang↙
Li↙
Fun↙
Wang↙
Li:4 (输出3个候选人的姓名与最后得票数)
Zhang:3
Fun:2
程序定义一个全局的结构体数组leader,它有3个元素,每一元素包含两个成员,即name(姓名)和count(得票数)。在定义数组时使之初始化,使3位候选人的票数都先置零。
在这个例子中,也可以不用字符数组而用string方法的字符串变量来存放姓名数据,程序可修改如下:
#include <iostream>
#include <string>
using namespace std;
struct Person
{
string name;//成员name为字符串变量
int count;
};
int main( )
{
Person leader[3]={″Li″,0,″Zhang″,0,″Fun″,0};
int i,j;
string leader_name;// leader_name为字符串变量
for(i=0;i<10;i++)
{
cin>>leader_name;
for(j=0;j<3;j++)
if(leader_name==leader[j].name) leader[j].count++//用“==”进行比较
}
cout<<endl;
for(i=0;i<3;i++)
{
cout<<leader[i].name<<″:″<<leader[i].count<<endl;
}
return 0;
}
一个结构体变量的指针就是该变量所占据的内存段的起始地址。可以设一个指针变量,用来指向一个结构体变量,此时该指针变量的值是结构体变量的起始地址。指针变量也可以用来指向结构体数组中的元素。
1. 通过指向结构体变量的指针引用结构体变量中的成员
下面通过一个简单例子来说明指向结构体变量的指针变量的应用。例7.3 指向结构体变量的指针的应用。
#include <iostream>
#include <string>
using namespace std;
int main( )
{
struct Student//声明结构体类型student
{
int num;
string name;
char sex;
float score;
};
Student stu;//定义Student类型的变量stu
Student *p=&stu;//定义p为指向Student类型数据的指针变量并指向stu
stu.num=10301;//对stu中的成员赋值
stu.name=″Wang Fun″;//对string变量可以直接赋值
stu.sex=′f′;
stu.score=89.5;
cout<<stu. num<<″ ″<<stu.name<<″ ″<<stu.sex<<″ ″<<
stu.score<<endl;
cout<<p -> num<<″ ″<<(*p).name<<″ ″<<(*p).sex<<″ ″<<
(*p).score<<endl;
return 0;
}
程序运行结果如下:
10301 Wang Fun f 89.5 (通过结构体变量名引用成员)
10301 Wang Fun f 89.5 (通过指针引用结构体变量中的成员)
两个cout语句输出的结果是相同的。
为了使用方便和使之直观,C++提供了指向结构体变量的运算符->,例如p->num表示指针p当前指向的结构体变量中的成员num。
p->num 和(*p).num等价。
同样
p->name等价于(*p).name。
也就是说,以下3种形式等价:
① 结构体变量.成员名。如stu.num。
② (*p).成员名。如(*p).num。
③ p->成员名。如p->num。
“->”称为指向运算符。
请分析以下几种运算:
p->n 得到p指向的结构体变量中的成员n的值。
p->n++ 得到p指向的结构体变量中的成员n的值,用完该值后使它加1。
++p->n 得到p指向的结构体变量中的成员n的值,并使之加1,然后再使用它。
2. 用结构体变量和指向结构体变量的指针构成链表
链表是一种常见的重要的数据结构。图7.8表示最简单的一种链表(单向链表)的结构。
图7.8
一是用户需要用的实际数据,
二是下一个结点的地址。
可以看到链表中各元素在内存中的存储单元可以是不连续的。要找某一元素,可以先找到上一个元素,根据它提供的下一元素地址找到下一个元素。
可以看到,这种链表的数据结构,必须利用结构体变量和指针才能实现。
可以声明一个结构体类型,包含两种成员,一种是用户需要用的实际数据,另一种是用来存放下一结点地址的指针变量。
例如,可以设计这样一个结构体类型:
struct Student
{
int num;
float score;
Student *next;//next指向Student结构体变量
};
其中成员num和score是用户需要用到的数据,相当于图7.8结点中的A,B,C,D。next是指针类型的成员,它指向Student类型数据(就是next所在的结构体类型)。用这种方法就可以建立链表。见图7.9。
图7.9
下面通过一个例子来说明如何建立和输出一个简单链表。
例7.4 建立一个如图7.9所示的简单链表,它由3个学生数据的结点组成。输出各结点中的数据。
#include <iostream>
struct Student
{
long num;
float score;
struct Student *next;
};
int main( )
{
Student a,b,c,*head,*p;
a. num=31001;
a.score=89.5;//对结点a的num和score成员赋值
b. num=31003;
b.score=90;//对结点b的num和score成员赋值
c. num=31007;
c.score=85;//对结点c的num和score成员赋值
head=&a;//将结点a的起始地址赋给头指针head
a.next=&b; //将结点b的起始地址赋给a结点的next成员
b.next=&c; //将结点c的起始地址赋给b结点的next成员
c.next=NULL; //结点的next成员不存放其他结点地址
p=head; //使p指针指向a结点
do
{
cout<<p->num<<″ ″<<p->score<<endl; //输出p指向的结点的数据
p=p->next; //使p指向下一个结点
} while (p!=NULL); //输出完c结点后p的值为NULL
return 0;
}
请读者考虑:
①各个结点是怎样构成链表的。
②p起什么作用?
本例是比较简单的,所有结点(结构体变量)都是在程序中定义的,不是临时开辟的,也不能用完后释放,这种链表称为静态链表。对各结点既可以通过上一个结点的next指针去访问,也可以直接通过结构体变量名a,b,c去访问。
动态链表则是指各结点是可以随时插入和删除的,这些结点并没有变量名,只能先找到上一个结点,才能根据它提供的下一结点的地址找到下一个结点。只有提供第一个结点的地址,即头指针head,才能访问整个链表。如同一条铁链一样,一环扣一环,中间是不能断开的。
建立动态链表,要用到后面介绍的动态分配内存的运算符new和动态撤销内存的运算符delete。将一个结构体变量中的数据传递给另一个函数,有下列3种方法:
- 用结构体变量名作参数。一般较少用这种方法。
- 用指向结构体变量的指针作实参,将结构体变量的地址传给形参。
- 用结构体变量的引用变量作函数参数。
下面通过一个简单的例子来说明,并对它们进行比较。
例7.5 有一个结构体变量stu,内含学生学号、姓名和3门课的成绩。要求在main函数中为各成员赋值,在另一函数print中将它们的值输出。
(1) 用结构体变量作函数参数
#include <iostream>
#include <string>
using namespace std;
struct Student//声明结构体类型Student
{
int num;
char name[20];
float score[3];
};
int main( )
{
void print(Student);//函数声明,形参类型为结构体Student
Student stu;//定义结构体变量
stu.num=12345;//以下5行对结构体变量各成员赋值
stu.name=″Li Fung″;
stu.score[0]=67.5;
stu.score[1]=89;
stu.score[2]=78.5;
print(stu);//调用print函数,输出stu各成员的值
return 0;
}
void print(Student st)
{
cout<<st.num<<″ ″<<st.name<<″ ″<<st.score[0]
<<″ ″ <<st.score[1]<<″ ″<<st.score[2]<<endl;
}
运行结果为
12345 Li Fung 67.5 89 78.5 (2)
(2)用指向结构体变量的指针作实参在上面程序的基础上稍作修改即可。
#include <iostream>
#include <string>
using namespace std;
struct Student
{
int num; string name;//用string类型定义字符串变量
float score[3];
}stu={12345,″Li Fung″,67.5,89,78.5};//定义结构体student变量stu并赋初值
int main( )
{
void print(Student *);//函数声明,形参为指向Student类型数据的指针变量
Student *pt=&stu;//定义基类型为Student的指针变量pt,并指向stu
print(pt);//实参为指向Student类数据的指针变量
return 0;
}
//定义函数,形参p是基类型为Student的指针变量
void print(Student *p)
{
cout<<p->num<<″ ″<<p->name<<″ ″<<p->score[0]<<″ ″ <<
p->score[1]<<″ ″<<p->score[2]<<endl;
}
调用print函数时,实参指针变量pt将stu的起始地址传送给形参p(p也是基类型为student的指针变量)。这样形参p也就指向stu,见图7.10。
在print函数中输出p所指向的结构体变量的各个成员值,它们也就是stu的成员值。在main函数中也可以不定义指针变量pt,而在调用print函数时以&stu作为实参,把stu的起始地址传给实参p。
图7.10
#include <iostream>
#include <string>
using namespace std;
struct Student
{
int num;
string name;
float score[3];
}stu={12345,″Li Li″,67.5,89,78.5};
void main( )
{
void print(Student &);
//函数声明,形参为Student类型变量的引用
print(stu);
//实参为结构体Student变量
}
//函数定义,形参为结构体Student变量的引用
void print(Student &stud)
{
cout<<stud.num<<″ ″<<stud.name<<″ ″<<stud.score[0]
<<″ ″ <<stud.score[1]<<″ ″<<stud.score[2]<<endl;
}
程序(1)用结构体变量作实参和形参,程序直观易懂,效率是不高的。
程序(2)采用指针变量作为实参和形参,空间和时间的开销都很小,效率较高。但程序(2)不如程序(1)那样直接。
程序(3)的实参是结构体Student类型变量,而形参用Student类型的引用,虚实结合时传递的是stu的地址,因而效率较高。它兼有(1)和(2)的优点。
引用变量主要用作函数参数,它可以提高效率,而且保持程序良好的可读性。在本例中用了string方法定义字符串变量,在某些C++系统中目前不能运行这些程序,读者可以修改程序,使之能在自己所用的系统中运行。