【自然语言处理】简单而强大的NLTK库

 

NLTK简介

NLTK是Python上著名的⾃然语⾔处理库。⾃带语料库,以及分词等功能。

NLTK被称为“使用Python进行教学和计算语言学工作的绝佳工具”,以及“用自然语言进行游戏的神奇图书馆”。

NLTK提供丰富的模块和功能⬇️

模块 功能
nltk.corpus 语料库
nltk.tokenize 分词
nltk.stem 句子主干
nltk.tag 词性标识符
nltk.collocation 搭配发现
nltk.classify, nltk.cluster 分类,分簇
nltk.chunk 分块
nltk.parse 解析
nltk.probability 概率与估计

 
 
 

NLTK简单使用


先检查一下自己的nltk

import nltk

# 查看一下nltk的简介(是否导入成功?)
print(nltk.__doc__)
# 查看一下语料库路径(是否成功下载语料库?)
print(nltk.data.find("corpora"))

 


瞧瞧自带的语料库

from nltk.corpus import brown		# 导入Brown语料库

print(brown
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值