nltk的简单应用

转载 2015年11月19日 11:12:24

简单例子

# -*- coding: utf-8 -*-
"""
http://www.nltk.org/
首页示例
"""
import nltk
 
# Tokenize and tag some text:
sentence = "At eight o'clock on Thursday morning Arthur didn't feel very good."
tokens = nltk.word_tokenize(sentence)
print tokens
 
tagged = nltk.pos_tag(tokens)
print tagged[0:6]
 
# Identify named entities:
entities = nltk.chunk.ne_chunk(tagged)
print entities
 
# Display a parse tree:
from nltk.corpus import treebank
t = treebank.parsed_sents('wsj_0001.mrg')[0]
t.draw()
 
# NLTK中文语料库 sinica_treebank
from nltk.corpus import sinica_treebank
sinica_text = nltk.Text(sinica_treebank.words())
print sinica_text
 
for (key, var) in sinica_treebank.tagged_words()[:8]:
    print '%s%s' % (key, var),
 
# NLTK中文句法树
sinica_treebank.parsed_sents()[15].draw()


演示使用NLTK让计算机学习如何通过名字识别性别

# -*- coding: utf-8 -*-
 
"""
演示使用NLTK让计算机学习如何通过名字识别性别。
"""
 
import nltk
 
# 定义学习方法
def gender_features(word):
    return {'last_letter':word[-1]}
 
# 导入学习的姓名性别名单
from nltk.corpus import names
import random
names = ([(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')])
random.shuffle(names)
 
# 开始学习
f = [(gender_features(n), g) for (n, g) in names]
trainset, testset = f[500:], f[:500]
c = nltk.NaiveBayesClassifier.train(trainset)
 
# 测试
print c.classify(gender_features('Neo'))
print c.classify(gender_features('Trinity'))



利用NLTK在Python下进行自然语言处理

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。自然语言工具箱(NLTK,Natural Language Toolkit)是一个基于Python语言的类库,它也是当前最为流行的自然语言编...

python自然语言处理(一)NLTK初步使用

NLTK是Python很强大的第三方库,可以很方便的完成很多自然语言处理(NLP)的任务,包括分词、词性标注、命名实体识别(NER)及句法分析。  一 nltk安装教程      首先,保证已经安...

nltk-构建和使用语料库-可用于小说的推荐-完整实例

步骤1:构建语料库: [python] view plain copy #!/usr/bin/env python   #-*-coding=ut...

nltk 自己训练模型例子

NLTK是Python的一个自然语言处理的模块,其中实现了朴素贝叶斯分类算法。以下,就使用上一篇文中提到的数据,来应用这个模块实现朴素贝叶斯分类。NLTK的实现更加泛化,所以在应用到我们的数据上时需要...

python的nltk中文使用和学习资料汇总帮你入门提高

nltk是一个python工具包, 用来处理和自然语言处理相关的东西. 包括分词(tokenize), 词性标注(POS), 文本分类, 等等现成的工具. 1. nltk的安装 资料1: 黄聪:Pyt...
  • huyoo
  • huyoo
  • 2013年09月30日 11:13
  • 52292

命名实体识别的两种方法

分别使用NLTK和Stanford的命名实体识别对英文文本进行处理以及方法的比较
  • babydx
  • babydx
  • 2017年09月04日 14:04
  • 1337

Python nltk -- Sinica Treebank

原url:http://cpmarkchang.logdown.com/posts/184192-python-nltk-sinica-treebank以下为原文:今天我們來談談如何用python n...

nltk在python中的安装,以及nltk的data库

最近开始学习Python+NLTK自然语言处理,在此分享自己的学习经验,因为是初学,肯定有很多很多不懂的地方,发布此文章绝非为了显示自己的水平,而是因为网络上对NLTK的资料实在太少了,我就想分享一下...
  • elikai
  • elikai
  • 2015年07月12日 10:37
  • 5894

NLTK内置NaiveBayesClassifier与传统朴素贝叶斯算法差异探究

朴素贝叶斯是有监督机器学习的一个经典算法。在了解了贝叶斯公式和朴素贝叶斯算法之后,我决定用一个简单的例子进行计算,并与已编写好的NLTK中的朴素贝叶斯算法对比,求证结果。这一对比,竟然发现了不少问题。...

使用NLTK的朴素贝叶斯分类器来训练并完成分类工作

NLTK是Python的一个自然语言处理的模块,其中实现了朴素贝叶斯分类算法。以下,就使用上一篇文中提到的数据,来应用这个模块实现朴素贝叶斯分类。NLTK的实现更加泛化,所以在应用到我们的数据上时需要...
  • cnweike
  • cnweike
  • 2015年08月10日 18:11
  • 7188
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:nltk的简单应用
举报原因:
原因补充:

(最多只允许输入30个字)