nltk的简单应用

转载 2015年11月19日 11:12:24

简单例子

# -*- coding: utf-8 -*-
"""
http://www.nltk.org/
首页示例
"""
import nltk
 
# Tokenize and tag some text:
sentence = "At eight o'clock on Thursday morning Arthur didn't feel very good."
tokens = nltk.word_tokenize(sentence)
print tokens
 
tagged = nltk.pos_tag(tokens)
print tagged[0:6]
 
# Identify named entities:
entities = nltk.chunk.ne_chunk(tagged)
print entities
 
# Display a parse tree:
from nltk.corpus import treebank
t = treebank.parsed_sents('wsj_0001.mrg')[0]
t.draw()
 
# NLTK中文语料库 sinica_treebank
from nltk.corpus import sinica_treebank
sinica_text = nltk.Text(sinica_treebank.words())
print sinica_text
 
for (key, var) in sinica_treebank.tagged_words()[:8]:
    print '%s%s' % (key, var),
 
# NLTK中文句法树
sinica_treebank.parsed_sents()[15].draw()


演示使用NLTK让计算机学习如何通过名字识别性别

# -*- coding: utf-8 -*-
 
"""
演示使用NLTK让计算机学习如何通过名字识别性别。
"""
 
import nltk
 
# 定义学习方法
def gender_features(word):
    return {'last_letter':word[-1]}
 
# 导入学习的姓名性别名单
from nltk.corpus import names
import random
names = ([(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')])
random.shuffle(names)
 
# 开始学习
f = [(gender_features(n), g) for (n, g) in names]
trainset, testset = f[500:], f[:500]
c = nltk.NaiveBayesClassifier.train(trainset)
 
# 测试
print c.classify(gender_features('Neo'))
print c.classify(gender_features('Trinity'))



相关文章推荐

NLTK中使用Stanford parser

原文链接:http://blog.csdn.net/qq_19670461/article/details/42681551nltk工具包中有一个用于自然语言句法分析的文件夹parse(地址C:\Py...

NLTK命名实体识别

引例:NLTK中对于很多自然语言处理应用有着开箱即用的api,但是结果往往让人弄不清楚状况。 下面的例子使用NLTK进行命名实体的识别。第一例中,Apple成功被识别出来,而第二例并未被识别。究竟是...

python nltk库的安装和简单使用

nltk库是python语言为自然语言处理提供的一个功能强大,简单易用的函数库,是学习和进行自然语言处理工作的出色工具,这里加少一下nltk模块的安装和简单使用 1.安装nltk windows系统:...

Windows下最简单安装NLTK的方法

最简单的windows下安装nltk的方法。

开发一个应用程序,使用 Python、NLTK 和机器学习对 RSS 提要进行分类

开发一个应用程序,使用 Python、NLTK 和机器学习对 RSS 提要进行分类 作者:Chris Joakim, 高级软件工程师, Primedia Inc 简介: 机器学习取决于 I...

[python+nltk] 自然语言处理简单介绍和NLTK坏境配置及入门知识(一)

本文主要是总结最近学习的论文、书籍相关知识,主要是Natural Language Pracessing(自然语言处理,简称NLP)和Python挖掘维基百科Infobox等内容的知识。 ...

探索 Python、机器学习和 NLTK 库 开发一个应用程序,使用 Python、NLTK 和机器学习对 RSS 提要进行分类

挑战:使用机器学习对 RSS 提要进行分类 最近,我接到一项任务,要求为客户创建一个 RSS 提要分类子系统。目标是读取几十个甚至几百个 RSS 提要,将它们的许多文章自动分类到几十个预定义的主题领...

nltk-3.2.4.win32.exe

  • 2017-08-18 15:27
  • 1.73MB
  • 下载

Python 环境下下载并安装NLTK说明

Python 环境下下载并安装NLTK
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)