- 博客(2)
- 资源 (9)
- 收藏
- 关注
原创 文本分析--jieba中文分词
分词技术可以分为英文分词和中文分词: 对于英文分词而言,由于英文单词之间以空格来分隔,所以在进行英文分词的过程中,只需要针对空格进行划分就可以了。 对于中文分词而言,中文单词之间没有英文单词天然的空格来划分,所以就需要对中文进行处理;主要有三种方式:一个是基于字典匹配的分词方法,一个是基于语义分析的分词算法,还有一个是基于概率统计模型的分词方法。以下介绍的是python中
2019-12-25 16:36:59 3969
原创 windows下pip换源
1、打开appdata文件夹,在资源管理器的地址栏输入%appdata%后回车:C:\Users\kevinelstri\AppData\Roaming\3、新建一个pip文件夹,在pip文件夹里面新建一个配置文件pip.ini:[global]timeout = 6000index-url = https://pypi.tuna.tsinghua.edu.cn/simpletrus...
2019-12-09 21:54:44 298
ourbestModel_highscore3500
2019-04-14
停用词表stopwords
2017-08-15
文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)
2017-04-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人