NLP
文章平均质量分 83
SaltedVegetable
写下的都是BUG
展开
-
Java API for WordNet Searching (JAWS)
https://mind.cs.byu.edu/projects/DARCI/source_code/source_code/LanguageAnalysis/doc/overview-summary.htmlhttps://github.com/VitaliyOliynyk/jaws/blob/master/src/main/java/edu/smu/tspell/wordnet/WordNetDatabase.javaloadWordNetString path = "C:\\Progra原创 2021-05-19 22:50:24 · 219 阅读 · 0 评论 -
The SPECIALIST Lexicon API
The SPECIALIST Lexicon JAVA API使用affix 为词缀,按缀位分为 prefix (前缀)和 suffix(后缀);按缀形分成 inflection (屈折词)和 derivation (衍生词)derivation 分为 prefix 和 suffix,如:happy 加suffix为happily,加prefix为unhappy.inflection 只在词尾加词缀,表时态,数,格等变化,如:ask,asks,asking,asked,etc.derivat原创 2021-05-19 12:36:21 · 599 阅读 · 0 评论 -
分类和标注词汇
一 使用词型标注器nltk.pos_tag() 对单词词性进行标记import nltktext=nltk.word_tokenize("And now for something completely different")print(nltk.pos_tag(text))import nltk# 同形同音异义词text=nltk.word_tokenize("They re...翻译 2019-11-07 10:22:14 · 323 阅读 · 0 评论 -
python NLTK——文本和单词
from nltk.book import *从NLTK的book中加载所有东西一 搜索文本text.concordance(word)在text中找到指定单词word并显示上下文text.similar(word)根据word的上下文单词的情况,来查找具有相似的上下文单词会在文本中搜索具有类似结构的其他单词只考虑一些简单的指标,不考虑语义text.common_context...翻译 2019-09-10 09:00:32 · 620 阅读 · 0 评论 -
语言处理与python
一 将文本当作单词列表1.列表加法——连接追加 append()2.索引列表text.index(word)word第一次出现的索引3.变量4.字符串二 简单统计1.频率分布FreqDist接受参数words后, 会统计words中每个word的频数,并返回一个字典,key是word,value是word在words中出现的频数。f = FreqDist(text1)...翻译 2019-09-10 17:01:59 · 327 阅读 · 0 评论 -
python NLP ——获得文本语料和词汇资源
一 获取文本语料库1.Gutenberg>>> from nltk.corpus import gutenberg>>> gutenberg.fileids()['austen-emma.txt', 'austen-persuasion.txt', 'austen-sense.txt', ...]>>> emma = gutenber...翻译 2019-09-15 10:34:42 · 1803 阅读 · 0 评论 -
python NLP——处理原始文本
一 从网络和硬盘访问文本电子书from urllib import requesturl = "http://www.gutenberg.org/cache/epub/5517/pg5517.txt"reponse=request.urlopen(url)raw=reponse.read().decode('utf8')print(raw[:75])如果你使用的Internet...翻译 2019-10-08 20:31:32 · 1332 阅读 · 0 评论