一、字符
golang的字符有两种
- 1.byte uint8,代表ASCII的一个字符
- 2.rune int32 ,是UTF-8字符,处理符合字符(汉语)的时需要用到
所以在go中,字符的本质是一个整数。
1.默认处理
char := 'c'
char1 := '你'
fmt.Printf("%T,%v ,%c\n", char, char, char)
fmt.Printf("%T,%v ,%c\n", char1, char1, char1)
//int32,99 ,c
//int32,20320,你
在不指定字符类型的时候是用rune处理(%T->类型,%v->相应值的默认格式,%c->字符)
2.指定处理方式
var byteC byte = 'j'
fmt.Printf("%T,%v ,%c,\n", byteC, byteC, byteC)
//uint8,106 ,j
var runeC rune = 'J'
fmt.Printf("%T,%v ,%c,\n", runeC, runeC, runeC)
//uint8,106 ,j
二、字符串
在go的string底层就是一个byte数组
默认是以UTF-8进行编码的,而UTF-8是一种变长的编码字符,字符长度从一个字节到4个字节不等。
如果字符是单个的ASCII字符,则是用byte存储占一个字节,如果是复合字符,如中文是存了三个字节。
栗子🌰:
data := "吃饭1"
fmt.Println(len(data))//7
fmt.Println(data[:1]) //�
fmt.Println(data[:3])//吃
上栗中字符串的长度是7而不是3,以为这里获取的是字节的长度,一个汉字占三个字节。直接获取第一个字节则会出现乱码。
避免出现这种因为字符类型出现的问题,需要做rune转换来处理数据
fmt.Println([]rune(data[:1]))//吃
使用range是默认当做[]rune来提取
for _, value := range a {
fmt.Println("type:", reflect.TypeOf(value))
fmt.Println("type:", value)
fmt.Println("type:", string(value))
}
//type: int32
//type: 21507
//type: 吃
//type: int32
//type: 39277
//type: 饭
//type: int32
//type: 49
//type: 1
总结
1、GO的字符本质是整数,单个字节,或者是多字节组合
2、byte uint8 一个字节,rune int32长度为4个字节
3、字符截取和下标索引都是根据字节为单位来产生的
4、range 遍历是使用的rune
参考:
Go 语言中的字符与字符串遍历