from __future__ import division;
from nltk.book import *;
def lexical_diversity(text):
return len(text) / len(set(text)); #建立函数测算某个文本中所有单词出现的平均次数
def percentage(count, total):
return 100 * count / total; #建立函数测算某个单词在某个文本中所占的百分比
'''
sent1 = ['I', 'AM', 'IRON', 'MAN']; #在python中定义text
print(len(sent1)); #测算text的长度
print(percentage(sent1.count("I"), len(sent1))); #调用函数
'''
'''
print(sent1);
print(sent2);
print(sent1 + sent2); #两个text可以相加,结果为后者放在前者后面
'''
#print(text4.index('awaken')); #在指定文本中查找特定单词的位置
#print(text4[0]); #查找文本中的第174个词
#print(text4[25:35]); #显示序号25到34的词汇
#sent = ['I', 'AM', 'IRON', 'MAN'