Golang中对是否是中文字符的判断方法
首先是用到的两个函数(截图来自 - Go语言中文网 https://studygolang.com/pkgdoc)
接下来是代码:
package main
import (
"fmt"
"regexp"
)
//注释解释的是上一行的代码
func main() {
str := "!@#中国123"
//设定一个含有中文的字符串
var a = regexp.MustCompile("^[\u4e00-\u9fa5]$")
//接受正则表达式的范围
for i, v := range str {
//golang中string的底层是byte类型,所以单纯的for输出中文会出现乱码,这里选择for-range来输出
if a.MatchString(string(v)) {
//判断是否为中文,如果是返回一个true,不是返回false。这俩面MatchString的参数要求是string
//但是 for-range 返回的 value 是 rune 类型,所以需要做一个 string() 转换
fmt.Printf("str 字符串第 %v 个字符是中文。是“%v”字\n", i+1, string(v))
}
}
}
结果如下:
这里面MatchString()方法并没有对于中文标点检查,如果需要通过正则表达式的修改来扩大范围,可以参考文章:http://caibaojian.com/zhongwen-regexp.html
里面有对正则表达式的介绍。