golang -----------字符串(rune,string,type)

一、内存布局

字符串在Go语言内存模型中用一个2字长的数据结构表示。它包含一个指向字符串存储数据的指针和一个长度数据。因为string类型是不可变的,对于多字符串共享同一个存储数据是安全的。切分操作str[i:j]会得到一个新的2字长结构,一个可能不同的但仍指向同一个字节序列(即上文说的存储数据)的指针和长度数据。这意味着字符串切分可以在不涉及内存分配或复制操作。这使得字符串切分的效率等同于传递下标。

例如:

func main() {
	s := "你好,22tcy2122tcy221212222" // UTF-8
	fmt.Println(len(s))    //结果:28

	//
	st := []rune(s)
	st1 := st[0:13]

	//下面两个地址一样
	fmt.Printf("%v\n",&st[0])    //结果:0xc04203e060
	fmt.Printf("%v\n",&st1[0])    //结果:0xc04203e060
}

二、字符串默认在堆上分配内存存储。字符串是通过char数组存储的,字符串是不可变的字节数组,其头部指针指向一个字节数组。

三、string在内存中的存储结构是长度固定的字节数组,也就是说是字符串是不可变的。当要修改字符串的时候,需要转换为[]byte,修改完成后再转换回来。但是不论怎么转换,都必须重新分配内存,并复制数据,通过加号拼接字符串,每次都必须重新分配内存。

优化1:

通过strings.join()进行拼接,它会统计所有参数的长度,并一次性完成内存的分配操作。

func main() {
	s := make([]string, 10)
	for i := 0; i < 3; i++ {
		s[i] = "tcy"
	}
	fmt.Println(strings.Join(s, "最棒"))//tcy最棒tcy最棒tcy最棒最棒最棒最棒最棒最棒最棒
}

 

优化2:

 

通过buffer进行组装拼接,使用buffer是优先创建一个缓冲区,然后向缓冲区中写入数据,类似Java中的StringBuffer

func main() {
	var b bytes.Buffer
	b.Grow(22)//缓存大小

	for i := 0; i < 22; i++ {
	b.WriteString("tcy")
	}

	fmt.Println(b.String())
	//tcytcytcytcytcytcytcytcytcytcytcytcytcytcytcytcytcytcytcytcytcytcy
}

 

四、实例:最长不重复子串,演示rune,string,type之间的关系

 

package main

import "fmt"

func nonRepeatingSubStr(s string) string{
	last := make(map[rune]int)   //该字符上一次出现的位置
	startTemp := 0               //距离当前下标不含重复字符的起始下标
	start := 0                    //当前最大不重复子串的起始下标
	maxLength := 0                //当前最大不重复子串的长度
	var res []rune                //存储rune子串

	//获取最长不重复子串的起始位置和长度(start,maxLength)
	st := []rune(s)              //这步很重要 见解释1
	for i,ch := range st{
		if lastI,ok := last[ch];  ok && lastI >= startTemp {
			startTemp = i
		}
		if i + 1 - startTemp >maxLength {
			maxLength = i+1 - startTemp
			start = startTemp
		}
		last[ch]=i
	}

	//拼装成字符串并返回
	var t,j int

	for j=start;j<start+maxLength;j++{
		temp := st[j]
		res = append(res,temp)
		t++
	}
	result := string(res)
	return result

}

func main() {
	fmt.Println(
		nonRepeatingSubStr("tcytcytcy1"))
	fmt.Println(
		nonRepeatingSubStr("ttttt"))
	fmt.Println(
		nonRepeatingSubStr("2221_22_23"))
	fmt.Println(
		nonRepeatingSubStr(""))
	fmt.Println(
		nonRepeatingSubStr("2"))
	fmt.Println(
		nonRepeatingSubStr("你好,tcy"))
	fmt.Println(
		nonRepeatingSubStr(
			"世界很大,出去看看"))
}

解释一:(rune,string,type)

1、type 占一个字节

2、rune 英文占一个字节,中文占三个字节

3、string底层是用byte数组存的,并且是不可以改变的。 

4、在 Go 中,字符串是以 UTF-8 为格式进行存储的,在字符串上调用 len 函数,取得的是字符串包含的 byte 的个数

例如 s:="你好"  fmt.Println(len(s))  输出结果应该是6,因为中文字符是用3个字节存的。
 

所以用string存储unicode的话,如果有中文,按下标是访问不到,如果想要获得我们想要的情况的话,需要先转换为rune切片再使用内置的len函数

func main() {
	s := "你好" // UTF-8
	fmt.Println(len(s))    //结果:6

	//
	st := []rune(s)
	fmt.Println(len(st))    //结果:2
}

 

  • 5
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值