Go语言学习笔记六--string编码

分解探索string编码

转为byte数组

func main() {
    s := "Hi小智加油!"

    fmt.Println("len(s):",len(s)) //len(s): 15 为什么是15呢?

    for _, v := range []byte(s) {
        fmt.Printf("%X ",v) //%X 转为16进制
        //48 69 E5 B0 8F E6 99 BA E5 8A A0 E6 B2 B9 21
        //猜测从第三个开始(E5 B0 8F) -> 小 ,后面都是三个字节代表一个汉字
        //其实utf-8 是使用的可变长度来编码的(世界上这么多语言,如果全部都是3个直接来编码,太浪费空间)
    }
}

通过打印我们猜测,这个byte数组中,中文汉字是使用3个字节来编码

直接遍历string

验证:上述猜想

func main() {
    for k, v := range s {   //v is a rune
        fmt.Printf("(%d,%X)",k,v)
    //(0,48)(1,69)(2,5C0F)(5,667A)(8,52A0)(11,6CB9)(14,21)
    }
}

如图for k, v := range sv是一个int32类型:

string遍历的value

发现从第三个开始汉字,下标正确2,但是下一个就变成了5,这说明,上面转为byte数组时我们的猜想是正确的,
一个汉字使用了3个byte来表示,但是这样遍历 根本不是我们想要的,因为下标的问题.

总结:既 直接遍历字符串时,k 为 byte数组的下标 而 v 却是int32类型(rune)

utf8工具类解码

    //使用 utf8工具类
    fmt.Println("s rune counts:",utf8.RuneCountInString(s))
    //s rune counts: 7 ,发现是s的长度是我们想要的了

既然可以得到正确的长度了,尝试一个字一个字解码

    bytes := []byte(s)
    for len(bytes)>0 {
        ch, size := utf8.DecodeRune(bytes) 
        //解码byte数组 返回rune和size长度
        bytes = bytes[size:] 
        //截取byte
        fmt.Printf("%c " ,ch)
    }
H i 小 智 加 油 !  //发现每个字符都被解码出来了

结论

在go中,rune就相当于Java中的char,而rune是uft8编码

正常遍历一个string的方法

    fmt.Println();
    for k, v := range []rune(s) { //直接将string转为rune切片
        fmt.Printf("(%d %c)",k,v) //%c 可以将rune转为 字符串
    }
(0 H)(1 i)(2 小)(3 智)(4 加)(5 油)(6 !) 得到了我们想要的答案.

TEST:查找到一个字符串中最长不重复字符串(国际版)

这里直接跳过了这个test的解题思路,如果没有看过的同学, 点击上篇查看

func findMaxNoRepeatString(s string) int {

    start := 0
    keysIndex := make(map[rune]int)
    lenth := 0

    for i, v := range []rune(s) { //将byte换成rune即可
        lastIndex, ok := keysIndex[v]
        if ok && lastIndex >= start {
            start = lastIndex + 1
        } else {
            lenth = i - start + 1
        }
        keysIndex[v] = i
    }
    return lenth
}

作者所有的学习源码在 go学习源码github地址,如果觉得有用的话帮小智贡献一个star?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值