![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 75
10086_
这个作者很懒,什么都没留下…
展开
-
flask
@(Python)[python|web] python下的web容器常见问题乱码问题 app.config['JSON_AS_ASCII'] = False # 设置后返回成中文app.config.update(RESTFUL_JSON=dict(ensure_ascii=False)) # 设置后返回成中文flask_apscheduler定时...原创 2018-09-12 17:47:33 · 321 阅读 · 0 评论 -
解决jieba分词 load_userdict 加载自定义词库太慢的问题
@(Python)文章目录1. 技术背景2. 结巴分词加载自身词库方法介绍3. 修改jieba默认词库4. 清除 jieba.cache缓存,重启jieba5.效果展示5.1 没修改词库前5.2 修改词库后6. 结论1. 技术背景 import jieba jieba.load_userdict("100MB.txt")问题来源 相信大家对上面2句话很熟悉,jieba分词加载自定义...原创 2018-12-24 17:54:53 · 32144 阅读 · 10 评论 -
pkuseg的自定义词库过大会导致出现严重的分词BUG?
1.背景说明【前情提要】 怀着异常激动的心情测试了一下北大刚发布的中文分词库,然后加载了之前整理的自定义词汇,发现出现了很严重的分词问题,希望有人能帮忙解决。2. 上代码 [IN] content = "我叫马化腾,我想学区块链,你说好不好啊,天青色等烟雨,而我在等你,月色被打捞器,晕开了结局" dict = utils.read("./dict.txt") pku = pkus...原创 2019-01-10 11:51:04 · 1846 阅读 · 3 评论