ntlk入门函数解释(text相加, join, split, 数组坐标调用)

这篇博客介绍了NLTK库的基础使用,包括text对象的相加、join、split等操作,适合初学者了解NLTK在自然语言处理中的基本应用。
摘要由CSDN通过智能技术生成

from __future__ import  division;
from nltk.book import *;

def lexical_diversity(text):
    return len(text) / len(set(text));      #建立函数测算某个文本中所有单词出现的平均次数

def percentage(count, total):
    return 100 * count / total;     #建立函数测算某个单词在某个文本中所占的百分比

'''
sent1 = ['I', 'AM', 'IRON', 'MAN']; #在python中定义text
print(len(sent1));  #测算text的长度
print(percentage(sent1.count("I"), len(sent1)));    #调用函数
'''
'''
print(sent1);
print(sent2);
print(sent1 + sent2);   #两个text可以相加,结果为后者放在前者后面
'''
#print(text4.index('awaken'));  #在指定文本中查找特定单词的位置
#print(text4[0]); #查找文本中的第174个词
#print(text4[25:35]);   #显示序号25到34的词汇

#sent = ['I', 'AM', 'IRON', 'MAN'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值