![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
文章平均质量分 92
JacksonKim
这个作者很懒,什么都没留下…
展开
-
自然语言处理:Word embedding 技术
自然语言处理:Word embedding 技术CBOW, Skip-gramword2vec(是一种概念,而不是技术)?fasttext(fastText模型架构和CBOW模型架构非常相似),glove(我们的模型通过只训练单词-单词共现矩阵中的非零元素来有效地利用统计信息,而不是训练整个稀疏矩阵或大型语料库中的单个上下文窗口。)...翻译 2022-03-05 19:38:07 · 981 阅读 · 0 评论 -
RDF和SPARQL
RDF(资源描述框架,Resource Description Framework)资源描述框架(RDF)是万维网联盟规格(World Wide Web Consortium)家族的一员,一开始它是一种描述元数据(metadata,描述数据的数据)的一种数据模型。但如今,已经成为了一种用于对web资源中实现的信息进行概念描述或建模的通用方法。它只规定了一些大致的规格,可以允许使用各种语法符号和数据序列化格式。所以RDF作为一种资源描述框架(规格说明),具体有哪些限制或者内容?https://en.wi翻译 2021-10-03 15:31:58 · 812 阅读 · 0 评论 -
词性标注,句法分析中NN,NP是什么意思
TreeBank是一种标注了句法和语义句子结构的大型语料库,这些句法结构通常是树的形式,所以称之为TreeBank(树库)。The Penn TreeBank是第一个提出的TreeBank语料库,这个语料库使用的词性标注的类别包含了NN,NP。必须要知道正式表示和用于存储注释数据的文件格式之间有很大的区别。树库必须根据特定的语法构建。不同的文件格式可以实现相同的语法。例如,右图所示的John Loves Mary的句法分析可以用文本文件中的简单标记括号表示,如下所示(遵循Penn Treebank表示法)翻译 2021-06-12 11:09:01 · 7610 阅读 · 0 评论