朴素贝叶斯思想的拼写检查器
#encoding=utf-8
import re,collections
#把语料中的单词都抽取出来,变成小写a-z,去掉特殊符号
def words(text):
return re.findall('[a-z]+',text.lower())
def train(features):
model=collections.defaultdict(lambda: 1)
for f in features:
model[f] += 1
return m
原创
2020-06-25 16:37:19 ·
155 阅读 ·
0 评论