python显示句子长度_语料库中每个文本的平均句子长度(python3&nltk)

这段代码演示了如何使用nltk库计算Inaugural演说语料库中所有文本的平均句子长度,以及每篇文本的平均句子长度。通过迭代每个文件,计算每个文件的句子总长度并除以句子数,得出平均值。
摘要由CSDN通过智能技术生成

尝试:>>> from __future__ import division

>>> from nltk.corpus import inaugural

>>> total_lens = 0

>>> for i, sent in enumerate(inaugural.sents()):

... total_lens += len(sent)

...

>>> total_lens

145735

>>> i

4867

>>> avg_sent_len = total_lens / i

>>> avg_sent_len

29.943497020752

>>> avg_sent_len = total_lens / (i+1)

>>> avg_sent_len

29.9373459326212

注意,当分母足够大时+1并不重要。在

Mirco在所有文本中平均句子长度

以下代码是一行代码,但不鼓励使用,因为您可能已经实现了生成器两次:

^{2}$

所有文本的Marco平均句子长度:>>> sum(sum(len(sent) for sent in inaugural.sents(fileids=[fileid])) / len(inaugural.sents(fileids=[fileid])) for fileid in inaugural.fileids()) / len(inaugural.file

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值