自然语言处理
文章平均质量分 76
Pinellia999
这个作者很懒,什么都没留下…
展开
-
CRF
来自http://blog.sina.com.cn/s/blog_53dfd4ff0101jf3s.html条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。一 .CRF条件随机场(conditional random fields),是一种转载 2016-03-22 16:53:52 · 1043 阅读 · 0 评论 -
CRF专业领域实体识别
命名实体识别是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。实体识别通常包括两部分:(1)实体边界识别;(2) 确定实体类别(人名、地名、原创 2016-03-22 18:17:54 · 4837 阅读 · 2 评论 -
LDA主题模型
这是比较好理解的LDA介绍。因为LDA涉及很多的数学知识。先抛开统计数学的很多知识,用这个对它有个整体的了解。两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻转载 2016-03-23 14:08:33 · 728 阅读 · 0 评论