NLP
我爱玩泥巴
这个作者很懒,什么都没留下…
展开
-
AWT-EventQueue-0 ERROR ProtegeApplication OutOfMemoryError
关于使用Sparqlquery tab 出现问题的描述: 打开sparql query 经常出现卡机,不能操作等问题,有时就会出现下面的错误提示: 2018-06-0408:25:15.955 [AWT-EventQueue-0] ERROR ProtegeApplication Uncaught Exception in thread'AWT-EventQueue-0'java.lang...原创 2018-06-04 10:24:22 · 1161 阅读 · 0 评论 -
sparql 查询例子
先说一下sparql可以做什么?1.可以从半结构化和结构化的数据中提取2.通过查询未知的关系可以挖掘数据3.使用单一简单的查询在分散的数据库中执行4.将RDF数据转化成其他词语# prefix declarations 前缀声明 example:PREFIX rdf: PREFIX owl: PREFIX rdfs: PREFIX xsd:翻译 2017-07-06 22:03:23 · 1394 阅读 · 0 评论 -
本体结构介绍
1.本体的结构OWL是语义网活动的一个组成部分。这项工作的目的是通过对增加关于那些描述或提供网络内容的资源的信息,从而使网络资源能够更容易地被那些自动进程访问。由于语义网络固有的分布性,OWL必须允许信息能够从分布的信息源收集起来。其中,允许本体间相互联系,包括明确导入其他本体的信息,能够部分实现这样的功能。另外,OWL提出了一个开放世界的假设。也就是说,对资源的描述并不局限于在一转载 2017-07-02 14:43:42 · 4159 阅读 · 0 评论 -
Python 分类和标注词汇
1.名词解释: 词性标注(part-of-speech tagging ,POS tagging):将词汇按照词性分类并相应地对他们进行分类 词性也称你为词类,词范畴。用于特定任务标记的集合被称为一个标记集。1.1 使用词性标注器 使用词性标注器处理一个词序列,为每一个词增加词性标记。 (a) pos_tag():词性标注 使用text.simi...原创 2019-04-10 21:45:45 · 1401 阅读 · 0 评论 -
FutureWarning: Conversion of the second argument of issubdtype from `float` to `np.floating` is depr
FutureWarning: Conversion of the second argument of issubdtype from `float` to `np.floating` is deprecated. In future, it will be treated as `np.float64 == np.dtype(float).type`. from ._conv import re...原创 2019-01-03 10:27:48 · 375 阅读 · 0 评论 -
Python解决unicode编码 \xe7\xbb\x87转化为中文
记录下学习过程中遇到的问题:将中文关键字提取后存入csv文件中,结果出现了如下结果:\xe7\xbb\x87\xe7\x89\xa9 \xe7\xbb\x93\xe5\x90\x88\xe9\x83\xa8 \xe7\xbb\x93\xe6\x9e\x84 \xe5\x86\x85\xe7\xae\xa1 \xe5 \x88\x86\xe9\x9a\x94 \xe8\x86\xa8\...原创 2018-12-01 15:24:29 · 66203 阅读 · 3 评论 -
2.1载入自己的语料库
使用PlaintextCorpusReader 载入自己的语料假设你的文件的位置:C:\cl form nltk.corpus import PlaintCorpusReader corpus_root=r'C:\cl' wordlist=PlaintextCorpusReader(corpus_root,'.*') print(wordlist.fi...原创 2018-04-04 14:58:07 · 1617 阅读 · 0 评论 -
python 制作词云 wordclound安装问题:is not a supported wheel on this platform
自作中文词云需要用到分词,这里使用的是“结巴”jieba 词库,直接在windows命令窗口下输入pip install jieba在导入wordcloud时出现了一些小问题:1.直接输入pip install wordclound 给出了好多错误Requirement already satisfied: wordcloud in d:\programfile\python\lib\site-p...原创 2018-04-11 15:10:23 · 2940 阅读 · 0 评论 -
第一章 获取语料库
1.获取文本语料通过import nltk.book 访问定义好的文本通过nltk.corpus.gutenberg.fileids()访问古藤堡项目的文件from nltk.corpus import gutenburg emma=gutenburg.fileids() print(emma) emma=gutenburg.words('austen-emma.txt...原创 2018-04-03 20:10:31 · 2250 阅读 · 0 评论 -
python nlp
natural language process(NLP)自然语言理解通过 pip install nltk进行安装输入import nltk nltk.downdowan()因为文件不大,可以全部安装现在开始抓取web页面我们引入urllib包,我使用的是python3.6,和版本2 在引入时有所区别。代码如下urllib urllib的request模块可以非常方便地抓取URL内容,...转载 2018-04-03 14:16:53 · 429 阅读 · 0 评论