熟知基本数据类型是我们正确表达实际问题中各种数据的前提,因此我分类总结了一下C/C++/Windows/linux 基本数据类型,以便日后查阅。
ANSI C/C++基本数据类型:
编写如下测试文件
charactor.cpp
#include <stdio.h>
int main(void)
{
printf(" bool \t\t\t is %d byte\n", sizeof(bool));
printf(" short [int] \t\t is %d byte\n", sizeof(short));
printf(" signed short [int] \t is %d byte\n", sizeof(signed short));
printf(" unsigned short [int]\t is %d byte\n", sizeof(unsigned short));
printf(" int \t\t\t is %d byte\n", sizeof(int));
printf(" signed [int] \t\t is %d byte\n", sizeof(signed));
printf(" unsigned [int] \t is %d byte\n", sizeof(unsigned));
printf(" long [int] \t\t is %d byte\n", sizeof(long));
printf(" signed long [int] \t is %d byte\n", sizeof(signed long));
printf(" unsigned long [int] \t is %d byte\n", sizeof(unsigned long));
printf(" long long [int] \t is %d byte\n", sizeof(long long));
printf(" char \t\t\t is %d byte\n", sizeof(char));
printf(" signed char \t\t is %d byte\n", sizeof(signed char));
printf(" unsigned char \t\t is %d byte\n", sizeof(unsigned char));
printf(" float \t\t\t is %d byte\n", sizeof(float));
printf(" double \t\t is %d byte\n", sizeof(double));
return 0;
}
编译
#g++ -o charactor++ charactor.cpp
运行
#./charactor++
bool is 1 byte
short [int] is 2 byte
signed short [int] is 2 byte
unsigned short [int] is 2 byte
int is 4 byte
signed [int] is 4 byte
unsigned [int] is 4 byte
long [int] is 4 byte
signed long [int] is 4 byte
unsigned long [int] is 4 byte
long long [int] is 8 byte
char is 1 byte
signed char is 1 byte
unsigned char is 1 byte
float is 4 byte
double is 8 byte
说明:
(1)类型修饰符signed和unsigned用于修饰字符型和整形。
(2)类型修饰符short和long用于修饰字符型和整形。
(3)当用signed和unsigned、short和long修饰int整形时,int可省略。
(4)其中bool和wchar_t是C++特有的。
(5)除上表以外,C/C++都可以自定义枚举enum、联合union和struct结构体类型。
(6)以上sizeof通过ubuntu linux 32位平台测试,其中某些类型数据的字节数和数值范围由操作系统和编译平台决定。比如16位机上,sizeof(int) = 2,而32位机上sizeof(int) = 4;32位机上sizeof(long) = 4,而64位机上sizeof(long) = 8。除此之外,注意64位机上的pointer占8byte。
(7)void的字面意思是“无类型”,不能用来定义变量。
void真正发挥的作用在于:
<1> 对函数返回和函数参数的限定,例如自定义既不带参数也无返回值的函数void MyFunc(void);
<2>定义无类型通用指针void *,指向任何类型的数据。
(8)标准C++库及STL还提供了通用数据结构:字符串类string、向量类模板vector、双端队列类模板deque、链表类模板list、容器适配器堆栈类stack(实现先进后出的操作)、容器适配器队列类queue(实现先进先出的操作)、集合类set、多重集合类multiset、映射类map、多重映射类multimap、位集合bitset、迭代器iterator (类似指针的功能,对容器的内容进行访问)。
(9)在标准C++中,int的定义长度要依靠你的机器的字长,也就是说,如果你的机器是32位的,int的长度为32位,如果你的机器是64位的,那么int的标准长度就是64位,而vc中__int64是为在32机位机器长实现64位长度的整形数。
(10)关于32位平台下的int和long
long从字面上看,应该是64位才更合理,把long当成32位实在是一个历史的包袱。像C#那样新起炉灶的程序语言,由于没有需要支持老代码的问题,就把long当作64位来处理了。
在32位平台下,long是相对short而言,long(short)类型是long(short) int类型的简称,sizeof(long) = sizeof(int) = 4。int和long的范围虽然一样,但输入输出格式不同,printf int的格式为%d,而printf long的格式为%ld。
考虑到程序的可移植性,还是要将他们区分开来。但当要求的数值范围为4byte时,建议使用int类型,因为第一版的C语言只有一种类型,那就是int。
(11)在Win32 API及MFC中为了使类型名称在语意上更明了,对以上基本类型进行了大量的typedef。例如WINDEF.H中的BYTE,WORD,DWORD。
(12)计算机内部内存的基本单位是1byte(8个电子开关)!
小贴士:
ANSI标准规定一个字符为1个字节或多个字节,UNICODE为宽字节字符串或者UNICODE字符串,规定每个字符都占两个字节。如“中国123”,ANSI编码为5字节,在UNICODE中为10字节。
Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。
由于不同 ANSI 编码所规定的标准是不相同的(字符集不同),因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种字符集则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。Unicode 有着统一的标准,它定义了世界上绝大多数的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文都能一同一种编码方式保存。
ANSI C/C++基本数据类型:
Type | Size | 数据范围 |
无值型void | 0byte | 无值域 |
布尔型bool | 1byte | true false |
有符号短整型short [int] /signed short [int] | 2byte | -32768~32767 |
无符号短整型unsigned short [int] | 4byte | 0~65535 |
有符号整型int /signed [int] | 4byte | -2147483648~2147483647 |
无符号整型unsigned [int] | 4byte | 0~4294967295 |
有符号长整型long [int]/signed long [int] | 4byte | -2147483648~2147483647 |
无符号长整型unsigned long [int] | 4byte | 0~4294967295 |
long long | 8byte | 0~18446744073709552000 |
有符号字符型char/signed char | 1byte | -128~127 |
无符号字符型unsigned char | 1byte | 0~255 |
宽字符型wchar_t (unsigned short) | 1byte | 0~65535 |
单精度浮点型float | 2byte | -3.4E-38~3.4E+38 |
双精度浮点型double | 4byte | 1.7E-308~1.7E+308 |
long double 8 byte | 8byte |
|
编写如下测试文件
charactor.cpp
#include <stdio.h>
int main(void)
{
printf(" bool \t\t\t is %d byte\n", sizeof(bool));
printf(" short [int] \t\t is %d byte\n", sizeof(short));
printf(" signed short [int] \t is %d byte\n", sizeof(signed short));
printf(" unsigned short [int]\t is %d byte\n", sizeof(unsigned short));
printf(" int \t\t\t is %d byte\n", sizeof(int));
printf(" signed [int] \t\t is %d byte\n", sizeof(signed));
printf(" unsigned [int] \t is %d byte\n", sizeof(unsigned));
printf(" long [int] \t\t is %d byte\n", sizeof(long));
printf(" signed long [int] \t is %d byte\n", sizeof(signed long));
printf(" unsigned long [int] \t is %d byte\n", sizeof(unsigned long));
printf(" long long [int] \t is %d byte\n", sizeof(long long));
printf(" char \t\t\t is %d byte\n", sizeof(char));
printf(" signed char \t\t is %d byte\n", sizeof(signed char));
printf(" unsigned char \t\t is %d byte\n", sizeof(unsigned char));
printf(" float \t\t\t is %d byte\n", sizeof(float));
printf(" double \t\t is %d byte\n", sizeof(double));
return 0;
}
编译
#g++ -o charactor++ charactor.cpp
运行
#./charactor++
bool is 1 byte
short [int] is 2 byte
signed short [int] is 2 byte
unsigned short [int] is 2 byte
int is 4 byte
signed [int] is 4 byte
unsigned [int] is 4 byte
long [int] is 4 byte
signed long [int] is 4 byte
unsigned long [int] is 4 byte
long long [int] is 8 byte
char is 1 byte
signed char is 1 byte
unsigned char is 1 byte
float is 4 byte
double is 8 byte
说明:
(1)类型修饰符signed和unsigned用于修饰字符型和整形。
(2)类型修饰符short和long用于修饰字符型和整形。
(3)当用signed和unsigned、short和long修饰int整形时,int可省略。
(4)其中bool和wchar_t是C++特有的。
(5)除上表以外,C/C++都可以自定义枚举enum、联合union和struct结构体类型。
(6)以上sizeof通过ubuntu linux 32位平台测试,其中某些类型数据的字节数和数值范围由操作系统和编译平台决定。比如16位机上,sizeof(int) = 2,而32位机上sizeof(int) = 4;32位机上sizeof(long) = 4,而64位机上sizeof(long) = 8。除此之外,注意64位机上的pointer占8byte。
(7)void的字面意思是“无类型”,不能用来定义变量。
void真正发挥的作用在于:
<1> 对函数返回和函数参数的限定,例如自定义既不带参数也无返回值的函数void MyFunc(void);
<2>定义无类型通用指针void *,指向任何类型的数据。
(8)标准C++库及STL还提供了通用数据结构:字符串类string、向量类模板vector、双端队列类模板deque、链表类模板list、容器适配器堆栈类stack(实现先进后出的操作)、容器适配器队列类queue(实现先进先出的操作)、集合类set、多重集合类multiset、映射类map、多重映射类multimap、位集合bitset、迭代器iterator (类似指针的功能,对容器的内容进行访问)。
(9)在标准C++中,int的定义长度要依靠你的机器的字长,也就是说,如果你的机器是32位的,int的长度为32位,如果你的机器是64位的,那么int的标准长度就是64位,而vc中__int64是为在32机位机器长实现64位长度的整形数。
(10)关于32位平台下的int和long
long从字面上看,应该是64位才更合理,把long当成32位实在是一个历史的包袱。像C#那样新起炉灶的程序语言,由于没有需要支持老代码的问题,就把long当作64位来处理了。
在32位平台下,long是相对short而言,long(short)类型是long(short) int类型的简称,sizeof(long) = sizeof(int) = 4。int和long的范围虽然一样,但输入输出格式不同,printf int的格式为%d,而printf long的格式为%ld。
考虑到程序的可移植性,还是要将他们区分开来。但当要求的数值范围为4byte时,建议使用int类型,因为第一版的C语言只有一种类型,那就是int。
(11)在Win32 API及MFC中为了使类型名称在语意上更明了,对以上基本类型进行了大量的typedef。例如WINDEF.H中的BYTE,WORD,DWORD。
(12)计算机内部内存的基本单位是1byte(8个电子开关)!
小贴士:
ANSI标准规定一个字符为1个字节或多个字节,UNICODE为宽字节字符串或者UNICODE字符串,规定每个字符都占两个字节。如“中国123”,ANSI编码为5字节,在UNICODE中为10字节。
Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。
由于不同 ANSI 编码所规定的标准是不相同的(字符集不同),因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种字符集则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。Unicode 有着统一的标准,它定义了世界上绝大多数的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文都能一同一种编码方式保存。