go语言字符串
一个Go语言字符串是一个任意字节的常量序列。
Go语言字符串与其他语言(Java,C++,Python)字符串的不同点
Go语言中字符串的字节使用UTF-8编码表示Unicode文本,因此Go语言字符串是变宽字符序列,每一个字符都用一个或者多个字符表示,这跟其他的(C++,Java,Python 3)的字符串类型有着本质上的不同,后者为定宽字符序列。
其他语言的字符串中的单个字符可以被字节索引,而Go语言中只有在字符串只包含7位的ASCII字符(因为它们都是用一个单一的UTF-8字节表示)时才可以被字节索引。那么这是不是表示Go语言在字符串处理能力上就比其他语言弱呢?答案时否定的,应为Go语言支持一个字符一个字符的迭代,而且标准库中存在大量的字符串操作函数,最后我们还可以将Go语言的字符串转化为Unicode码点切片(类型为 []rune
),切片是支持直接索引的。
对于英文文本,Go使用8位来表示每一个字节,而Java或Python则需要16位或更多。采用UTF-8编码,使得Go语言无需关系机器码的排列顺序,也无需编码解码来使用其他语言。
注&#x