【golang】浅析rune,byte

本文深入探讨了Golang中的rune和byte类型。rune作为int32类型,能够处理更多Unicode字符,而byte是int8类型,主要用于ASCII编码。在UTF-8编码的Golang字符串中,一个中文字符占3个字节。文章通过示例说明了如何正确遍历和处理字符串,强调了在处理Unicode字符时使用rune的重要性,并对比了两者的使用场景差异。
摘要由CSDN通过智能技术生成

【golang】浅析rune,byte

golang内置类型有rune类型和byte类型。

需要知晓的是rune类型的底层类型是int32类型,而byte类型的底层类型是int8类型,这决定了rune能比byte表达更多的数。

在unicode中,一个中文占两个字节,utf-8中一个中文占三个字节,golang默认的编码是utf-8编码,因此默认一个中文占三个字节,但是golang中的字符串底层实际上是一个byte数组。因此可能会出现下面这种奇怪的情况

str := "hello 世界"
fmt.Println(len(str)) //12

我们期望得到的结果应该是8,原因是golang中的string底层是由一个byte数组实现的,而golang默认的编码是utf-8,因此在这里一个中文字符占3个字节,所以获得的长度是12,想要获得我们想要的结果也很简单,golang中的unicode/utf8包提供了用utf-8获取长度的方法

str := "hello 世界"
fmt.Println(utf8.RuneCountInString(
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值