nlp
power0405hf
这个作者很懒,什么都没留下…
展开
-
CRF++的初步使用(1)
1.前言条件随机场(Conditional Random Field,CRF)在自然语言处理中有着十分广泛的应用, CRF条件随机场简介 而开源的CRF++避免了我们一个一个的去造轮子。我们来看一下CRF++是如何使用的。2.CRF++的下载原始网址: CRF++: Yet Another CRF toolkit 我下的win版: CRF++0.58 windows3.CRF++初步运行w转载 2015-07-10 22:10:04 · 2245 阅读 · 0 评论 -
NLTK——NLP编程的基础工具
1.NLTK入门1.下载NLTK,可用pip install nltk,anaconda本身已经有NLTK了,可直接使用。2.下载NLTK的范例文本,import nltknltk.download()#下载Collections下的book3.使用基本函数3.1 concordance 查找指定词from nltk.book import *text1.concordance("monst原创 2015-07-06 22:29:13 · 2263 阅读 · 0 评论 -
NLTK 2 获得文本语料和词汇资源
1 获得文本语料库1.1 古登堡语料库(Project Gutenberg)#nltk包含gutenberg的一小部分文本import nltknltk.corpus.gutenberg.fileids()emma=nltk.corpus.gutenberg.words('austen-emma.txt')print len(emma) #192427f原创 2015-07-07 13:50:06 · 1259 阅读 · 0 评论 -
python-crfsuite API 中文
python-crfsuite API 原文1. class pycrfsuite.ItemSequencecrfsuite ItemSequence的一个封装,是在单个序列中用来保存所有项目的特征的。 使用这个类可以直接传数据到Trainer或者Tagger中。 通过使用这个类可以节省一些时间,如果相同的输入序列传递给Trainer/Tagger不止一次——特征不会多次被processed翻译 2015-07-17 09:34:28 · 13413 阅读 · 0 评论 -
Python KNN 情感分类
1. 数据向量化2. 降维(PCA)3. KNN分类4. 交叉验证原创 2015-08-04 23:03:58 · 1359 阅读 · 0 评论