每日总结
授渔
这个作者很懒,什么都没留下…
展开
-
NLP浅谈语料库
NLP浅谈语料库1. 浅谈语料库1.1 预料和语料库 语料通常指在统计自然语言处理中实际上不可能观测到大规模的语言实例。所以人们简单地用文本作为替代,并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。 语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。其具备三个显著的特点:语料库中存放的是在语言的实际使用中真实出现过的语言材料。语料库以电子计算机为载体承载语言知识的基础资源,但并不等于语言知识。真实材料需要经过加工(分析和处理),才能成为有用的资源原创 2020-07-23 20:28:21 · 9924 阅读 · 0 评论 -
相似词处理
相似词处理1. 简介同义词挖掘一般有三种思路,借助已有知识库,上下文相关性,文本相似度。1.1 知识库可以借助已有知识库得到需要同义词,比如说《哈工大信息检索研究室同义词词林扩展版》和 HowNet,其中《词林》文件数据如下。Aa01A01= 人 士 人物 人士 人氏 人选Aa01A02= 人类 生人 全人类Aa01A03= 人手 人员 人口 人丁 口 食指Aa01A04= 劳力 劳动力 工作者Aa01A05= 匹夫 个人Aa01A06= 家伙 东西 货色 厮 崽子 兔崽子 狗崽子 小子原创 2020-07-22 19:23:04 · 883 阅读 · 0 评论 -
Word Embedding
Word Embedding1. 基本概念1.1 什么是Word Embedding现有的机器学习方法往往无法直接处理文本数据,因此需要找到合适的方法,将文本数据转换为数值型数据,由此引出了Word Embedding的概念。如果将word看作文本的最小单元,可以将Word Embedding理解为一种映射,其过程是:将文本空间中的某个word,通过一定的方法,映射或者说嵌入到另一个数值向量空间1.2 Word Embedding的输入Word Embedding的输入是原始文本中的一组不重叠的原创 2020-07-21 21:42:02 · 370 阅读 · 0 评论 -
7.14总结
7.14总结1. 运行第一个ROS小海龟程序2. ROS基础概念2.1 ROS的系统架构2.1.1 文件系统级功能包(package):是ROS中软件组织的基本形式,一个功能包具有最小的结构和最少的内容,用于创建ROS程序;指的是一种特定的文件结构和文件夹组合功能包清单:manifests.xml 通过这个文件实现对功能包的管理;功能包集(stack):将几个具有某些功能的功能包组织在一起,如导航功能包集;功能包集清单:stack.xml消息类型:消息类型的说明存储在 my_pack原创 2020-07-14 21:58:39 · 212 阅读 · 0 评论