Golang 字符的匹配和统计

example1
package main

import (
	"fmt"
	"strings"
	"unicode/utf8"
)

var str = "你好(hello)Go"

func one() {
	fmt.Println(strings.Count(str, ""))
	fmt.Println(strings.Count(str, "o"))
}

func two() {
	fmt.Println(len(str))
	fmt.Println(len([]byte(str)))
}

func three() {
	fmt.Println(utf8.RuneCount([]byte(str)))
	fmt.Println(utf8.RuneCountInString(str))
}

func four() {
	var (
		keys []int
		strs []string
	)

	for key, i := range str {
		keys = append(keys, key)
		strs = append(strs, string(i))
	}
	fmt.Println(keys)
	fmt.Println(strs)
}

func main() {
	one()
	two()
	three()
	four()
}
strings.count

strings.count(str,substr) 通常是统计str中出现substr的次数,但是如果substr为空,返回的结果 = RuneCountInString([]byte(str)) + 1

len

len 统计的是字节数量

统计兼容中文

如果要把中文算一个单位进行统计,请使用 utf8.RuneCount 类似的方法

range

对字符串的 range 是按照 rune 进行迭代的,所以 range的 key 有可能是不连续的

匹配中文

只要知道中文的取值范围,我们就能正确的使用正则来匹配中文,中文的unicode是从一(\u4e00)开始,到龥(\u9fa5)结束的,使用正则 + range 去匹配中文

package main

import (
    "fmt"
    "regexp"
)

var str = "我Go爱你"

func main() {
    fmt.Println("\u4e00") //一
    fmt.Println("\u9fa5") //龥

    filterChineseStr(&str)
    fmt.Println(str) //我爱你
}

func filterChineseStr(str *string) {
    var newStr string
    reg := regexp.MustCompile("^[\u4e00-\u9fa5]$")

    for _, s := range *str {
        if reg.MatchString(string(s)) {
            newStr += string(s)
        }
    }
    *str = newStr
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值