字符串
变量与常量
字符串变量
- 字符串是以空字符’\0’结束的字符数组
- 空字符自动添加到字符串的内部表示中
- 在声明字符串变量时,应该为这个空间结束符预留一个额外元素的空间。如:
char strHelloWorld1[11]={“helloworld”};
字符串常量
- 字符串常量是一对双引号括号括起来的字符序列
- 字符串中每个字符作为一个数组元素存储
- 例如字符串"helloworld"
关于字符表示的说明
代码 | 机器码表示 |
---|---|
char c1=0; | 0x00 |
char c2=’\0’; | 0x00 |
char c3=‘0’; | 0x30 |
编码
ASCII码表
ASCII(American Standard Code for Information Interchange),美国信息交换标准代码。是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。
它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。
ASCII码使用指定的7位或8位二进制数组合来表示128或256种可能的字符。
例如:
ASCII: 百度百科.
Unicode编码
最初的目的是把世界上的文字都映射到一套字符空间中
- 为了表示unicode字符集,有3种(确切的说是5种)Unicode的编码方式:
- UTF-8:1byte表示字符,可以兼容ASCII码。不停效率高,变长(不方便内存随机访问),无字节序问题(可作为外部编码)。
- UTF-16分为UTF-16BE(big endian),UTF-16LE(little endian).定长(方便内部随机访问),有字节序问题(不可作为外部编码)
- UTF-32:分为UTF-32BE(big endian),UTF-32-LE(little endian).定长(方便内部随机访问),有字