转载自 https://www.cnblogs.com/golove/p/3273585.html
unicode 包
package main
import (
"fmt"
"unicode"
)
func special_character() {
fmt.Println() // 数字
for _, r := range "Hello 123123一二三!" {
if unicode.IsDigit(r) {
fmt.Printf("%c", r)
}
} // 123123
fmt.Println() // 数字
for _, r := range "Hello 123123一二三!" {
if unicode.IsNumber(r) {
fmt.Printf("%c", r)
}
} // 123123
fmt.Println() // 字母
for _, r := range "Hello\n\t世界!" {
if unicode.IsLetter(r) {
fmt.Printf("%c", r)
}
} // Hello世界
fmt.Println() // 空白
for _, r := range "Hello \t世 界!\n" {
if unicode.IsSpace(r) {
fmt.Printf("%q", r)
}
} // ' ''\t''\u3000''\n'
fmt.Println() // 控制字符
for _, r := range "Hello\n\t世界!" {
if unicode.IsControl(r) {
fmt.Printf("%#q", r)
}
} // '\n''\t'
fmt.Println() // 可打印
for _, r := range "Hello 世界!\t" {
if unicode.IsPrint(r) {
fmt.Printf("%c", r)
}
} // Hello世界!
fmt.Println() // 图形
for _, r := range "Hello 世界!\t" {
if unicode.IsGraphic(r) {
fmt.Printf("%c", r)
}
} // Hello 世界!
fmt.Println() // 掩码
for _, r := range "Hello ៉៊់៌៍!" {
if unicode.IsMark(r) {
fmt.Printf("%c", r)
}
} // ៉៊់៌៍
fmt.Println() // 标点
for _, r := range "Hello 世界!" {
if unicode.IsPunct(r) {
fmt.Printf("%c", r)
}
} // !
fmt.Println() // 符号
for _, r := range "Hello (<世=界>)" {
if unicode.IsSymbol(r) {
fmt.Printf("%c", r)
}
} // <=>
}
func main() {
for _, r := range "Hello 世界!" {
// 判断字符是否为汉字
if unicode.Is(unicode.Scripts["Han"], r) {
fmt.Printf("%c", r) // 世界
}
}
fmt.Println()
for _, r := range "Hello ABC!" {
// 判断字符是否为大写
if unicode.IsUpper(r) {
fmt.Printf("%c", r) // HABC
}
}
for _, r := range "Hello abc!" {
// 判断字符是否为小写
if unicode.IsLower(r) {
fmt.Printf("%c", r) // elloabc
}
}
fmt.Println()
for _, r := range "Hello ᾏᾟᾯ!" {
// 判断字符是否为标题
if unicode.IsTitle(r) {
fmt.Printf("%c", r) // ᾏᾟᾯ
}
}
fmt.Println()
s := "Hello 世界!"
for _, r := range s {
fmt.Printf("%c", unicode.ToUpper(r))
} // HELLO 世界!
for _, r := range s {
fmt.Printf("%c", unicode.ToLower(r))
} // hello 世界!
for _, r := range s {
fmt.Printf("%c", unicode.ToTitle(r))
} // HELLO 世界!
for _, r := range s {
fmt.Printf("%c", unicode.To(unicode.UpperCase, r))
} // HELLO 世界!
for _, r := range s {
fmt.Printf("%c", unicode.To(unicode.LowerCase, r))
} // hello 世界!
for _, r := range s {
fmt.Printf("%c", unicode.To(unicode.TitleCase, r))
} // HELLO 世界!
fmt.Println()
fmt.Println("special_character")
special_character()
}
## regexq包
package main
import (
"fmt"
"regexp"
)
func regex(){
// 示例:第一匹配和最长匹配
b := []byte("abc1def1")
pat := `abc1|abc1def1`
reg1 := regexp.MustCompile(pat) // 第一匹配
reg2 := regexp.MustCompilePOSIX(pat) // 最长匹配
fmt.Printf("%s\n", reg1.Find(b)) // abc1
fmt.Printf("%s\n", reg2.Find(b)) // abc1def1
b = []byte("abc1def1")
pat = `(abc|abc1def)*1`
reg1 = regexp.MustCompile(pat) // 第一匹配
reg2 = regexp.MustCompilePOSIX(pat) // 最长匹配
fmt.Printf("%s\n", reg1.Find(b)) // abc1
fmt.Printf("%s\n", reg2.Find(b)) // abc1def1
}
func regex_info(){
pat := `(abc)(def)(ghi)`
reg := regexp.MustCompile(pat)
// 获取正则表达式字符串
fmt.Println(reg.String()) // (abc)(def)(ghi)
// 获取分组数量
fmt.Println(reg.NumSubexp()) // 3
fmt.Println()
// 获取分组名称
pat = `(?P<Name1>abc)(def)(?P<Name3>ghi)`
reg = regexp.MustCompile(pat)
for i := 0; i <= reg.NumSubexp(); i++ {
fmt.Printf("%d: %q\n", i, reg.SubexpNames()[i])
}
// 0: ""
// 1: "Name1"
// 2: ""
// 3: "Name3"
fmt.Println()
// 获取字面前缀
pat = `(abc1)(abc2)(abc3)`
reg = regexp.MustCompile(pat)
fmt.Println(reg.LiteralPrefix()) // abc1abc2abc3 true
pat = `(abc1)|(abc2)|(abc3)`
reg = regexp.MustCompile(pat)
fmt.Println(reg.LiteralPrefix()) // false
pat = `abc1|abc2|abc3`
reg = regexp.MustCompile(pat)
fmt.Println(reg.LiteralPrefix()) // abc false
}
func main() {
// 函数
// 判断在 b(s、r)中能否找到 pattern 所匹配的字符串
//func Match(pattern string, b []byte) (matched bool, err error)
//func MatchString(pattern string, s string) (matched bool, err error)
//func MatchReader(pattern string, r io.RuneReader) (matched bool, err error)
//
将 s 中的正则表达式元字符转义成普通字符。
//func QuoteMeta(s string) string
pat := `(((abc.)def.)ghi)`
src := `abc-def-ghi abc+def+ghi`
fmt.Println(regexp.MatchString(pat, src))
// true <nil>
fmt.Println(regexp.QuoteMeta(pat))
// \(\(\(abc\.\)def\.\)ghi\)
regex()
fmt.Println()
fmt.Println("正则信息")
regex_info()
}