一:需求
将一句话,标注为,合格或者优秀
二:方法
jieba分词
三:判定方法
当一句话中包含(学生信息、家长意向、学习情况)中的任意2个词就判定为为优秀,否则判定为合格。
四:用户自定义文本如图
import jieba
import jieba.analyse
# 方法一:通过文件导入自定义的分词 注:文件保存格式UTF-8
jieba.load_userdict("userword.txt")
# 方法二:过页面写入自定义的分词
# jieba.add_word('学生信息')
# jieba.add_word('学习情况')
# 切换词库,使用制定的词库
jieba.set_dictionary("userword.txt")
# 方法一:通过文件导入停用词
stopwords =[line.strip() for line in open('stopwords.txt', encoding='UTF-8').readlines()]
# 方法二:通过页面写入停用词 注:空格只能使用方法二,方法一无法去除空格
# stopwords = {}.fromkeys(['了', '啦', '呢', '在',' '])
#定义文本
text