语音语言处理
文章平均质量分 94
by Dan Jurafsky and James H. Martin
hioog
这个作者很懒,什么都没留下…
展开
-
向量语义模型
上下文(context)对于计算词(word)的相关性来说是一个很重要的概念。出现在相似上下文的词更倾向具有相似的含义。词的分布相似性和含义相似性之间的关联称为分布假设(distributional hypothesis)。这个假设是于19世纪50年代由语言学家们提出来的。他们发现同义词(如oculist和eye-doctor)更容易出现在相同环境中(附近的词如eye和examined)。并且(Harris,1954)认为两个词间的含义差异值大致等于其环境中的差异值。本文重点阐述向量语义(vector s原创 2021-02-05 12:51:02 · 2119 阅读 · 0 评论 -
情感分类与朴素贝叶斯
本文介绍一种机器学习分类算法——朴素贝叶斯算法及其在NLP中的应用。NLP中的分类许多自然语言处理任务涉及分类,分类也是人类和机器智能的核心。文本分类文本分类是将整个文本或文档赋值标签或类别的任务。文本分类的应用包括,主题分类(subject category classification)、情感分析(sentiment analysis)、垃圾邮件检测(spam detection)等。其他分类任务分类对于文档级别以下的任务也很重要。比如句号消歧(period disambigution)用原创 2021-01-24 14:00:20 · 803 阅读 · 0 评论