自然语言处理
墙角的秋天
这个作者很懒,什么都没留下…
展开
-
python自然语言处理(一)
1标识化处理word_tokenize()是一种通用的,面向所有语料库的标识化方法,基本能应付绝大多数。 reges_tokenize()基于正则表达式,自定义程度更高。#!/user/bin/env python#-*- coding:utf-8 -*-import reimport operatorimport nltkstring = "Thanks to a han...原创 2018-03-26 12:09:01 · 1347 阅读 · 0 评论 -
python自然语言处理(二)
1词性标注简单的理解就是对词性(POS)进行标注,但在不同的领域,词性可能是不同的,Penn Treebank pos标记库:https://blog.csdn.net/u010099495/article/details/46776617 其中程序需要安装两个依赖包nltk.download('punkt')nltk.download('averaged_perceptron_t...原创 2018-04-01 12:34:35 · 720 阅读 · 0 评论