《Python自然语言处理》第二章习题部分答案

8.在名字语料库上定义一个条件频率分布,看看哪个首字母在男性名字中比在女性名字中更常用

从性别入手,首先我们得知道>>>names=nltk.corpus.names

>>>names.fileids()

['femal.txt','male.txt']#具体在书上P66

 

15.编写一段程序,找出所有在布朗语料库中出现至少3次的词

 16.编写一段程序,生成如表1-1所示的词汇多样性得分表(例如:标识符/类型的比例)。包括布朗语料库文体的全集(nltk.corpus.brown.categories()).哪个文体词汇多样性最低(每个类型的标识符数最多)?和你预测的结果相同吗?

 20.编写一个函数word_freq(),用一个词和布朗语料库中的一个部分名字作为参数,计算这部分语料中词的频率

22.定义一个函数hedge(text),用于处理文本并产生一个在每三个词之间插入一个词like的新版本。

23.齐夫定律

 

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值