对于支持单字符的编程语言,比如C/C++, 字符被当成整型保存,当作整数做运算,简单直接。字符串数据更多,分配新的内存区域保存更合适。
存储格式
- C/C++对于char *字符串只利用一个规则,结尾为NULL字符’\0’算结束,只保存首地址,不需保存长度。C++支持string类,一般会封装字符串data指针和长度讯息(加速获取字符串长度)。
- char *字符串天生的缺点是如果忘记了结束的’\0’将一直被当做字符串数据。
- 修改”hello”为”he\0llo”, 字符串变为”he”.
- C++ string类提供c_str()返回const char *指针。data()和c_str()一样,C++17修改为非const字符串返回char *.
- Delphi在字符串数据前面插入长度信息。
- Java String类封装数据成员char value[], 早期版本有hashCode成员辅助,新版本增加了encoding,可支援更小数据量的Latin编码。
太长的字符串
大部分编程语言提供续行符连接成更长的字符串。
- C/C++
char str[100] = “Hello, \
World!”;
运行结果为:Hello, World! (中间有3个空格) 当然编译也会告警:warning: backslash and newline separated by space.
为了避免续行后行开始的空格被当做字符串,也提供字面量相连的方式。
char str[100] = "Hello, " "World!"; // 输出Hello, World! (中间只有一个空格)
C++11原始字面量包裹的字符串不用续行符就可以换行,换行保存在字符串中。
- C#
不支持’\’续行符连接字符串,可以在字符串前面加’@’符号连接字符串,缺点一样是会把回车符加进去。一种比较好的做法是直接用’+’运算符做字符串连接。
- Python
Python字符串里面的续行符不会自动加换行,这很不错。如下a字符串为: “aaabbb”
a = “aaa\
bbb”
同样也支持字面量相连,a = ‘a”b’ # a字符串为 “ab”
微风不燥,阳光正好,你就像风一样经过这里,愿你停留的片刻温暖舒心。
我是程序员小迷(致力于C、C++、Java、Kotlin、Android、iOS、Shell、JavaScript、TypeScript、Python等编程技术的技巧经验分享),若作品对您有帮助,请关注、分享、点赞、收藏、在看、喜欢,您的支持是我们为您提供帮助的最大动力。
欢迎关注。助您在编程路上越走越好!