Go 语言里的字符串的内部实现使用UTF-8
编码 go语言中字符串是双引号包裹的
go语言中单引号包裹的是字符
单独的一个字母、汉字、符号表示一个字符
字节:1个字节=8Bit(8个二进制位)
1个字符'A'=1个字节
1个utf8编码的汉字'你' = 一般占3个字节
Go语言中要定义一个多行字符串时,就必须使用反引号字符:
s1 := `第一行
第二行
第三行
`
fmt.Println(s1)
len(str) | 求长度 |
---|---|
+ 或 fmt.Sprintf | 拼接字符串 |
strings.Split | 分割 |
strings.contains | 判断是否包含 |
strings.HasPrefix,strings.HasSuffix | 前缀/后缀判断 |
strings.Index(),strings.LastIndex() | 子串出现的位置 |
strings.Join(a[]string, sep string) | join操作 |
字符串遍历
func traversalString() {
s := "hello沙河"
for i := 0; i < len(s); i++ { //byte
fmt.Printf("%v(%c) ", s[i], s[i])
}
fmt.Println()
for _, r := range s { //rune
fmt.Printf("%v(%c) ", r, r)
}
fmt.Println()
}
104(h) 101(e) 108(l) 108(l) 111(o) 230(æ) 178(²) 153() 230(æ) 178(²) 179(³)
104(h) 101(e) 108(l) 108(l) 111(o) 27801(沙) 27827(河)
字符串底层是一个byte数组,所以可以和[]byte
类型相互转换。字符串是不能修改的 字符串是由byte字节组成,所以字符串的长度是byte字节的长度。 rune类型用来表示utf8字符,一个rune字符由一个或多个byte组成。
字符串修改
要修改字符串,需要先将其转换成[]rune
或[]byte
,完成后再转换为string
。无论哪种转换,都会重新分配内存,并复制字节数组。
s := "hello 中国"
s1 := []byte(s)
s1[6] = 'H' //s1[0] = 'H' 是可以的
fmt.Println(s,s1,string(s1))
//`hello 中国 [104 101 108 108 111 32 72 184 173 229 155 189] hello H��国`
s := "hello 中国"
s1 := []rune(s)
s1[6] = 'H'
fmt.Println(s,s1,string(s1))
//`hello 中国 [104 101 108 108 111 32 72 22269] hello H国`
byte和rune类型:
Go 语言的字符有以下两种:
uint8
类型,或者叫 byte 型,代表了ASCII码
的一个字符。
rune
类型,代表一个 UTF-8字符
。
数组、切片、字符串之间的关系
这段话总结的不错。。。。
3个数据类型的底层都有着相同的内存结构,只是上层的语法做了不同的限制。。
数组是值类型,元素可以被修改、数组本身的复制和传参都是复制拷贝的
字符串底层是字节数组,但是golang规定字符串是只读的,所以禁止在程序中对字符数组进行更改。字符串赋值只是复制了数据的地址和长度,并不对导致底层数据的复制。。
切片和字符串类型,但是解除了只读属性,底层是对应类型的数组,但是复制后每个切片都有自己独立的长度和容量信息,但是他们共同拥有相同的数组。。。。