python
py_mxy
这个作者很懒,什么都没留下…
展开
-
数据挖掘经典算法复现:朴素贝叶斯
原理: P(Ci|W) = P(w1w2…wn|C)P(Ci) / P(W) Ci为类别原创 2017-03-14 22:24:25 · 533 阅读 · 0 评论 -
正则表达式:前瞻,后顾,负前瞻,负后顾
前瞻:exp1(?=exp2) 查找exp2前面的exp1后顾:(?<=exp2)exp1 查找exp2后面的exp1负前瞻:exp1(?!exp2) 查找后面不是exp2的exp1负后顾:(?<!exp2)exp1 查找前面不是exp2的exp1import re#pattern = re.compile('(?<!左上)腹痛')print(re.find...原创 2019-05-05 11:49:30 · 1143 阅读 · 0 评论 -
同一项目中不同模块调用不同词典的jieba分词的方法
问题描述:模块A使用了基于词粒度的深度学习模型,训练的过程是独立的并没有放进项目环境中,而在本项目的其他模块中加入了自定义字典,导致项目jieba分词的词典环境与模型独立训练过程中的环境不同,一个query进来模型拿不到与训练过程中同样的分词结果,所以结果与预期有出入。解决方法:#新建一个分词器,使该分词器与模型训练过程中有相同的自定义字典import jiebatokenizer1 =...原创 2019-05-08 16:51:41 · 723 阅读 · 0 评论