排序:
默认
按更新时间
按访问量

自然语言处理(NLP) 六:主题建模

import warnings warnings.filterwarnings('ignore',category=UserWarning) import nltk.tokenize as tk import nltk.corpus as nc import nltk.stem.snowbal...

2018-06-10 12:16:56

阅读数:124

评论数:0

自然语言处理(NLP) 五:情感分析

import nltk.corpus as nc import nltk.classify as cf import nltk.classify.util as cu pdata = [] fileids = nc.movie_reviews.fileids('pos') for file...

2018-06-10 11:28:28

阅读数:166

评论数:0

自然语言处理(NLP) 四:性别识别

import random import numpy as np import nltk.corpus as nc import nltk.classify as cf male_names = nc.names.words('male.txt') female_names = nc.na...

2018-06-10 10:56:55

阅读数:92

评论数:0

自然语言处理(NLP) 三:词袋模型 + 文本分类

1.词袋模型 (BOW,bag of words) 用词频矩阵作为每个样本的特征 Are you curious about tokenization ? Let’s see how it works! we need to analyze a couple of sentences wit...

2018-06-10 10:08:35

阅读数:391

评论数:0

自然语言处理(NLP) 二:词形还原 + 词块划分

1、词形还原 名字:复数->单数 动词:分词->原型 import nltk.stem as ns words = ['table','probably','wolves','playing','is','dog','the','beaches'...

2018-06-09 22:51:58

阅读数:291

评论数:0

自然语言处理(NLP) 一: 分词、分句、词干提取

需要安装nltk自然语言处理包,anaconda默认已经安装了 还需要安装nltk语料库:http://www.nltk.org/data.html 自然语言基础知识: 1、分词 鱼香肉丝里面多放点辣椒 对称加密需要DES处理引擎 天儿冷了多穿点 Are you curious...

2018-06-09 22:22:47

阅读数:1012

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭