写在前面
最近开始学习Go语言,因为自己是从Java逐步转Go原因,在感慨Go语言简便的同时,也因为其封装的数据类型和包较多,所以还得慢慢学习。今天来谈谈Go语言中的rune数据类型。
名词解释
Go语言中的整数类型也有有符号数和无符号数之别,分别用int 和uint表示,也分别由8、16、32、64位之分。Go语言中有一种特殊的数据类型rune,该数据类型与int32是同义词,或者说其本身只是int32的别称。
为何要有rune
那么既然rune和int32等价,为什么还需要有rune这种数据类型呢?我是这么理解的,rune相当于对int32类型的重新封装,是对int32使用场景的特殊化,rune主要用于处理unicode以及utf-8字符。感觉就是适用场景划分的细粒度化
举个例子
说这么多,不如举个例子,请看下面这个简单的Go代码片段:
package main
import (
"fmt"
)
func main() {
testStr := "this is a test!"
testStr1 := "这是一个测试"
fmt.Println("The length of str is: ",len(testStr))
fmt.Println("字符串长度为: ",len(testStr1))
}
结果输出应该是15以及6,但是实际的输出是:
The length of str is: 15
字符串长度为: 18
之所以会出现这样的情况,是因为Go语言字符串的底层是byte[]字节数组,在默认的utf-8编码中,英文字符占8位,一个字节,而中文是3个字节,所以这里len()函数输出的是字节数组的额长度,自然第一个是15、第二个是18。所以,这边应该输出utf-8编码的字符串的真实长度,代码见下:
package main
import (
"fmt"
"unicode/utf8"
)
func main() {
testStr := "this is a test!"
testStr1 := "这是一个测试"
fmt.Println("The length of str is: ",len(testStr))
//fmt.Println("字符串长度为: ",len(testStr1))
fmt.Println("字符串长度为: ",utf8.RuneCountInString(testStr1))
fmt.Println("字符串长度为: ",len([]rune(testStr1)))
}
输出结果为:
The length of str is: 15
字符串长度为: 6
字符串长度为: 6
可以看到,主要的解决方式有两个,第一个是调用utf8.RuneCountInString( ) 函数,将该字符串以rune的数据类型计算长度,另外一种就是将字符串底层的字节数组转换为rune类型的数组,再计算长度:len([]rune(testStr1))