- 博客(6)
- 收藏
- 关注
原创 计算机网络部分英文缩写汇总
(以下按字母顺序排列,持更)List itemIAB:Internet Architecture Board,负责管理因特网有关协议的开发Internet:互联网,通用名词,泛指由多个计算机网络互连而成的网络Internet:因特网,专用名词,指当前全球最大的、开放的、由众多网络相互连接而成的特定计算机网络,它采用TCP/IP协议簇作为通信的规则,且前身是美国的ARPANETISO:国际标准化组织ISOC:Internet Society,因特网协会,对因特网进行全面管理,以及在世界范围内
2021-06-20 16:49:21
5828
2
原创 分类和标注词汇
将词汇按它们的词性(parts-of-speech,POS)分类以及相应的标注它们的过程被称为词性标注(part-of-speech tagging, POS tagging)或干脆简称标注。词性也称为词类或词汇范畴。用于特定任务的标记的集合被称为一个标记集。我们在本章的重点是利用标记和自动标注文本。使用词性标注器一个词性标注器(part-of-speech tagger 或 POS tagger)处理一个词序列,为每个词附加一个词性标记(不要忘记 import nltk):>>>
2021-04-21 21:39:43
466
原创 编写结构化程序
回到基础赋值>>> foo = 'Monty'>>> bar = foo >>> foo = 'Python' >>> bar'Monty'>>> foo'Python'对对象的引用>>> foo = ['Monty', 'Python']>>> bar = foo >>> foo[1] = 'Bodkin' >>> b
2021-04-09 20:32:30
198
原创 加工原料文本
本章例子默认最前面导入了下面句子>>> from __future__ import division>>> import nltk, re, pprint从网络和硬盘访问文本电子书http://www.gutenberg.org/catalog/免费在线书籍中获得 ASCII 码文本文件的 URL编号 2554 的文本是《罪与罚》的英文翻译,我们可以如下方式访问它>>> from urllib import urlopen>&g
2021-02-25 15:27:36
374
原创 获得文本语料和词汇资源
获取文本语料库古腾堡语料库方法一(麻烦)>>> import nltk>>> nltk.corpus.gutenberg.fileids()['austen-emma.txt', 'austen-persuasion.txt', 'austen-sense.txt', 'bible-kjv.txt','blake-poems.txt', 'bryant-stories.txt', 'burgess-busterbrown.txt','carroll-alic
2021-02-11 09:25:56
1172
3
原创 语言处理与python
语言处理与python语言计算:文本和单词搜索文本计数词汇近观Python:将文本当作词链表链表索引列表合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入语言计算:文本和单词在这里,把文本视为我们写的程序的原始数据,这些程序以很多有趣的方式
2021-02-06 16:34:10
620
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人