python自然语言处理
文章平均质量分 69
thinkerCoder
985计算机硕士,大型外企研发工程师
展开
-
【python自然语言处理】规则分词(最大匹配法)
基于规则的分词,主要是通过维护词典,在切分语句时,将语句的每个字符串与词表中的词逐一匹配,找到则切分,否则不切分。以上主要总结了三种规则匹配方法,正向最大匹配法,逆向最大匹配法,和双向最大匹配算法,并给出了相应的代码实现,以上代码都可以直接运行出结果。原创 2023-03-09 10:06:50 · 1149 阅读 · 0 评论 -
【python自然语言处理】正则表达式
正则表达式主要用于字符串的模式匹配,或者是字符的匹配。正则表达式还可以将一些非结构化的文档内容转化为结构化。另外一个作用是去除噪声,可以将无关的文本内容去除掉。原创 2023-03-08 14:48:18 · 231 阅读 · 0 评论