NLTK 基础知识总结

最新推荐文章于 2024-07-23 16:23:28 发布

2401_83412087

最新推荐文章于 2024-07-23 16:23:28 发布

阅读量876

点赞数 17

分类专栏：程序员文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_83412087/article/details/138974210

版权

程序员专栏收录该内容

694 篇文章 1 订阅

订阅专栏

计数词汇

#!/usr/bin/env python

-- coding: utf-8 --

@Time : 2018-9-28 22:21

@Author : Manu

@Site :

@File : python_base.py

@Software: PyCharm

from future import division

import nltk

import matplotlib

from nltk.book import *

from nltk.util import bigrams

单词搜索

print(‘单词搜索’)

text1.concordance(‘boy’)

text2.concordance(‘friends’)

相似词搜索

print(‘相似词搜索’)

text3.similar(‘time’)

#共同上下文搜索

print(‘共同上下文搜索’)

text2.common_contexts([‘monstrous’,‘very’])

词汇分布表

print(‘词汇分布表’)

text4.dispersion_plot([‘citizens’, ‘American’, ‘freedom’, ‘duties’])

词汇计数

print(‘词汇计数’)

print(len(text5))

sorted(set(text5))

print(len(set(text5)))

重复词密度

print(‘重复词密度’)

print(len(text8) / len(set(text8)))

关键词密度

print(‘关键词密度’)

print(text9.count(‘girl’))

print(text9.count(‘girl’) * 100 / len(text9))

频率分布

fdist = FreqDist(text1)

vocabulary = fdist.keys()

for i in vocabulary:

print(i)

高频前20

fdist.plot(20, cumulative = True)

低频词

print(‘低频词：’)

print(fdist.hapaxes())

词语搭配

print(‘词语搭配’)

words = list(bigrams([‘louder’, ‘words’, ‘speak’]))

print(words)

NLTK设计目标

简易性；
一致性；
可扩展性；
模块化；

NLTK中的语料库

古腾堡语料库：gutenberg；
网络聊天语料库：webtext、nps_chat；
布朗语料库：brown；
路透社语料库：reuters；
就职演说语料库：inaugural；
其他语料库；

最后

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Java工程师，想要提升技能，往往是自己摸索成长，自己不成体系的自学效果低效漫长且无助。

因此收集整理了一份《2024年Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Java开发知识点，不论你是刚入门Java开发的新手，还是希望在技术上不断提升的资深开发者，这些资料都将为你打开新的学习之门！

如果你觉得这些内容对你有帮助，需要这份全套学习资料的朋友可以戳我获取！！

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且会持续更新！
新手，还是希望在技术上不断提升的资深开发者，这些资料都将为你打开新的学习之门！**

如果你觉得这些内容对你有帮助，需要这份全套学习资料的朋友可以戳我获取！！

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且会持续更新！

关注

17
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
NLTK 基础知识总结

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。深知大多数Java工程师，想要提升技能，往往是自己摸索成长，自己不成体系的自学效果低效漫长且无助。因此收集整理了一份《2024年Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。