NLP 搜索文本 计数词汇

4 篇文章 0 订阅

基于上一篇博客,已经得到各文本的数据,现在开始对这些数据进行处理:搜索文本

1、利用concordance函数来查找文本中的词:如monstrous、affection、lived

2、利用similar函数查找相似文本

3、common_contexts函数研究共用两个或两个以上词汇的上下文

4、利用dispersion_plot函数绘制离散图

计数词汇:

使用len函数获取长度,使用set获取唯一词汇,sorted函数得到一个排序表(大写字母出现在小写字母之前)

接下来,统计特定的词:

计数一个单词在文本中出现的次数,计算一个特定词在文本中占据的百分比

使用函数对几个文本重复计算,调用即可

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值