正则表达式的汉字匹配
看的老外的书,里面匹配的是英文单词。想到博大的汉语应该如何匹配呢,从网上搜了这个资料,介绍编码较为全面。
而另外想到的一个问题: 在构建匹配时,关键的是定义 pattern,如何确定pattern,确定要匹配哪些关键词才是最主要的。不然简单地统计某篇文章里面哪些字出现的最多,意义不大,需要明确词。
看的老外的书,里面匹配的是英文单词。想到博大的汉语应该如何匹配呢,从网上搜了这个资料,介绍编码较为全面。
而另外想到的一个问题: 在构建匹配时,关键的是定义 pattern,如何确定pattern,确定要匹配哪些关键词才是最主要的。不然简单地统计某篇文章里面哪些字出现的最多,意义不大,需要明确词。