用python来看语料数据库中人物的关系——python自然语言处理习题

最近几天,我参加了一个会议CLSW,当然由于疫情原因,全程在网上进行。会议包含了汉语教学,词汇语法,还有自然语言处理方面的讨论,听了以后,我心里真是热血沸腾,结果听了一小部分的老公比我还激动,立马叫我开始做NLP的习题,额……

         翻开那本闲置已久的书,老公唰唰唰翻到习题集,挑了个他认为比较难的,说:“就是这道题了,今天做完。你看这道题多有意思啊!”我一看,哼,小菜一碟,不就是翻翻书,套个公式吗?真是小瞧我了!

        老公特起劲地给我在电脑上下相关数据包,结果发现,原网址怎么都下载不下来,后来只能去Github上搜索nltk_data的相关资源,这回倒是可以下了,但是迅雷非会员那个速度,真的是一言难尽。

       兜兜转转搞定所有基础工作,我终于开始输入第一行代码。这个题目选哪个代码呢?我选择了这个公式

       自信地输入了公式,fdist2.plot(fdist2['Elinor']),结果出来一张黑乎乎的图,

      这什么鬼东西,和我想象的不一样啊。仔细看,似乎是把所有的词给我画了张图,怎么搞得?这个plot好像不太对劲啊。凡事问百度,搜了一通后,我意识到plot后面应该给X轴,Y轴,好,我来定义一下。

x_data = ['Elinor','Marianne','Edward','Willoughby']

y_data = [fdist2['Elinor'],fdist2['Marianne'],fdist2['Edward'],fdist2['Willoughby']]

还是不对……继续研究,原来这个plot只能对于已排序的词频用啊……最后复制了网上的某行代码

plt.plot(x_data,y_data,color='red',linewidth=2.0,linestyle='--')

plt.show()

这下出来了一张漂亮的折线图

嘿嘿,一看Elinor、Marianne就是主角啊,所以这是一部关于女性的小说,做完了。我继续翻书,看有没有公式能找出两人关系的,突然,我看到了这个

怎么好像应该用这个……试了一下这个公式,果然……

       哇,清晰明了,所以,我刚才费那么大劲儿是在干嘛?不一样清晰地看出这是一个女性为主的小说吗?

       第二个问题实在难倒我了,怎么样判断里面是不是有一对夫妻呢?我试了以下的代码:

text2.common_contexts(['Elinor','Edward'])

text2.common_contexts(['Elinor','Marianne'])

text2.common_contexts(['Elinor','Willoughby'])

text2.dispersion_plot(['Elinor','Marianne','Edward','Willoughby','wife'])

text2.common_contexts(['Elinor love','Edward'])

text2.concordance('affection')

text2.similar('wife')

        能看出来的是女的挺爱哭的,对自己生活满意度挺高,还能看出女主角之间挺有爱,两人都很爱自己的妈妈,可是夫妻不夫妻的真的看不出来。如果有谁能根据上面那张图看出来人物关系,欢迎私信我!

阅读原文

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值