[golang]-go中字符串操作和转换简介

golang中字符串是一种基本类型(string),是一个不可改变的UTF-8字符序列:

  • 一个ASCII码占用1个字节;
  • 其它字符根据需要占用2-4个字节;

字符串

字符串创建后,就不可改变;即不允许修改。

声明与初始化

golang支持两种类型的字符串字面量:

  • 解释型字符串:双引号括起来的字符串(“”),转义字符(如\n\r等)会被替换掉;
  • 非解释型字符串:用反引号(键盘左上角上的)括起来的字符串,转义字符不会被解释且可跨行(原样输出);

字符串声明与初始化非常容易:

var s1 string
s2 := "hello"

多行字符串使用反引号:

s := `hello
 world!
 line2`
fmt.Println(s)

长度

len()返回字符串中的字节数(非字符数目),索引操作s[i]返回字符串s中第i个字节的值(非Ascii码返回对应字节的数值)。要获取对应字符数(包含非ASCII字符时)需要使用utf8.RuneCountInString

s1 := "W字符"
fmt.Println(len(s1))  // 7 (一个汉字3个字节)
fmt.Println(utf8.RuneCountInString(s1)) // 3

比较

字符串比较的方式有如下三种:

  • ==:直接比较,区分大小写(效率最高);
  • strings.Compare(a,b):返回值为 int, 0 表示两数相等,1 表示 a>b, -1 表示 a<b。区分大小写;
  • strings.EqualFold(a,b):直接返回是否相等,不区分大小写。

拼接

golang中有多种字符串拼接方法:

  • 加号(+):最常用、方便的,但每次拼接都会生成一个新的字符串,效率较低;
  • fmt.Sprintf():通过格式化字符串方式拼接;
  • strings.Join():可以指定拼接时的间隔符;
  • bytes.Buffer:可变大小的字节缓冲区,提供方便地读写操作;
  • strings.Builder:通过write方法高效地构造字符串,最小化内存拷贝;

一般简单拼接直接使用+,字符串数组/切片拼接为字符串时用Join,多条不相关字符串拼接时用Builder。

var buff bytes.Buffer
buff.WriteString("hello")
buff.WriteRune('字')
buff.WriteString("符")
fmt.Println(buff.String()) // hello字符

var build strings.Builder
build.WriteString("hello")
build.WriteRune('字')
build.WriteString("符")
fmt.Println(build.String()) // hello字符

子串

go中可通过切片方式快速获取子串s=src[low:high](指定索引范围,‘左含右不含’)。索引不能越界,否则会导致panic异常。

s1 := "abcdef"
fmt.Println(s1[1:4],s1[1:],s1[:1]) // bcd bcdef a

对于包含中文的字符串,需要转换为rune后操作(否则会出现乱码):

  • 字符串转换为rune切片:
  • 切片截取;
  • 截取结果转换回string;
name := "test中文字符串测试"
runeName := []rune(name)
log.Printf("ori-len: %v, rune-len: %v", len(name), len(runeName))
for i := 2; i <= len(runeName); i++ {
	log.Printf("%v-len: %v", i, string(runeName[:i]))
}

遍历

有两种遍历方式:下标与range。下标方式遍历时,输出的是每个字节;要输出对应的Unicode字符,需要通过range方式。

s1 := "W字符"
// 输出7个数值(每个字节对应数值)
for i:=0; i<len(s1); i++{
	fmt.Println(s1[i])
}

// 输出三个字符(分别:W 字 符)
for i, v:=range s1{
	fmt.Println(i, string(v))
}

修改

golang中字符串内容默认不能修改,若要修改需要转换为[]byte或[]rune类型修改后再转回:

s1 := "W字符"
b1 := []byte(s1)
fmt.Println(len(b1)) // 7
b1[0] = 'M'
fmt.Println(string(b1)) // M字符

r1 := []rune(s1)
fmt.Println(len(r1)) // 3
r1[1] = '世'
fmt.Println(string(r1)) //W世符

strings包

strings中包含了一些常用的字符串操作函数,在涉及到字符串修改时,返回新的串。

  • 前后缀:HasPrefix、HasSuffix;
  • 是否包含:Contains;
  • 大小写转换:ToLower、ToUpper、Title;
  • 修剪:Trim、Trimleft、TrimRight;TrimSpace去除空白
  • 拼接拆分:Join、Split、Fields(根据空白分割);
  • 查找位置(-1表示表示未找到):Index、LastIndex、IndexRune;
  • 统计数量:Count;
  • 重叠串:Repeat,重复n次生成新的串;
  • 替换:Replace,可指定替换数量,负数表示全部替换;

Map

func Map(mapping func(rune) rune, s string) string,根据mapping函数修改s中的字符,并返回修改后新的串;若mapping返回负值,则删除对应字符。

rot13 := func(r rune) rune {
	switch {
	case r >= 'A' && r <= 'Z':
		return 'A' + (r-'A'+13)%26
	case r >= 'a' && r <= 'z':
		return 'a' + (r-'a'+13)%26
	}
	return r
}
fmt.Println(strings.Map(rot13, "Twas brillig and the slithy gopher..."))

Reader

用于读取字符串,实现了io.Reader、io.ReaderAt、io.Seeker、io.WriterTo、io.ByteScanner、io.RuneScanner。

r := strings.NewReader("abcdefghijklmn")
fmt.Println("total len:", r.Len())   // 14
var buf []byte
buf = make([]byte, 5)
readLen, err := r.Read(buf)
fmt.Println("read len:", readLen) // 5
if err != nil {
	fmt.Println("error:", err)
}
fmt.Println(string(buf))            // abcde
fmt.Println("remain len:", r.Len())	// 9   读取到了5个 剩余未读是14-5
fmt.Println("size:", r.Size()) 		// 14   字符串的长度

Replacer

用于字符串替换;placer中包含要替换字符串的列表,且是线程安全的:

r := strings.NewReplacer("<", "&lt;", ">", "&gt;")
fmt.Println(r.Replace("This is <b>HTML</b>!")) // This is &lt;b&gt;HTML&lt;/b&gt;!

strconv包

strconv包用于字符串与其它类型间的转换:

  • 整数转字符串:strconv.FormatInt、strconv.FormatUint、strconv.Itoa(相当于FormatInt(i, 10));
  • 布尔转字符串(“true” 或 “false”):strconv.FormatBool;
  • 浮点转字符串:strconv.FormatFloat;
  • 字符串转整数:strconv.ParseInt、strconv.ParseUint、strconv.Atoi(相当于ParseInt(s, 10, 0));
  • 字符串转布尔:strconv.ParseBool(1,t,T,TRUE,true,True为真;0,f,F,FALSE,false,False为假);
  • 字符串转浮点:strconv.ParseFloat;
  • appendXXX:在[]byte后追加对应类型;

在转换时,会出现两种类型的错误:

  • ErrRange:表示值超过了类型能表示的最大范围。
  • ErrSyntax:表示语法错误。

字符串转整数

func ParseInt(s string, base int, bitSize int)(i int64, err error)

  • s:要转换的字符串
  • base:进位制(2~36 进制),0根据字符串判断进制(0x:16,0:8,其它:10);
  • bitSize:指定整数类型(0:int、8:int8、16:int16、32:int32、64:int64)

常用的Atoi,是一个简易版,相当于ParseInt(s, 10, 0)

浮点数转字符串

func FormatFloat(f float64, fmt byte, prec, bitSize int) string

  • f:要转换的浮点数
  • fmt:格式标记(b、e、E、f、g、G)
  • prec:精度(数字部分的长度,不包括指数部分)
  • bitSize:指定浮点类型(32:float32、64:float64

FormatFloat参数只接收64位浮点,要转换32位浮点可:

  • 使用fmt.Sprintf实现;
  • 使用FormatFloat:需转为float64,但bitSize使用32
	var v32 float32 = 3.1415926535
	var v64 float64 = 3.1415926535
	s32 := fmt.Sprintf("%.4f", v32)
	s32_1 := strconv.FormatFloat(float64(v32), 'f', 4, 32)
	s64 := strconv.FormatFloat(v64, 'f', 4, 64)

格式标记:

  • ‘b’ (-ddddp±ddd,二进制指数)
  • ‘e’ (-d.dddde±dd,十进制指数)
  • ‘E’ (-d.ddddE±dd,十进制指数)
  • ‘f’ (-ddd.dddd,没有指数)
  • ‘g’ (‘e’:大指数,‘f’:其它情况)
  • ‘G’ (‘E’:大指数,‘f’:其它情况)
f := 100.123456789
fmt.Println(strconv.FormatFloat(f, 'b', 5, 32)) // 13123382p-17
fmt.Println(strconv.FormatFloat(f, 'e', 5, 32)) // 1.00123e+02
fmt.Println(strconv.FormatFloat(f, 'E', 5, 32)) // 1.00123E+02
fmt.Println(strconv.FormatFloat(f, 'f', 5, 32)) // 100.12346
fmt.Println(strconv.FormatFloat(f, 'g', 5, 32)) // 100.12
fmt.Println(strconv.FormatFloat(f, 'G', 5, 32)) // 100.12

字符串转浮点数

通过ParseFloat(s string, bitSize int) (float64, error)可方便地把字符串转为float64;若要转换为float32,需要bitSize传32,并把结果直接转换为float32即可。

	v := "3.1415926535"
	r64, _ := strconv.ParseFloat(v, 64)
	r, _ := strconv.ParseFloat(v, 32)
	r32 := float32(r)
	fmt.Println(r64, r32)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值