NLP词性标注笔记(一)

NLP词性标注笔记(一)任务要求1.利用HMM、MEMM、CRF、Perception训练词性标注任务2.分别计算每个模型在中文数据集(CTB5,gsd_simple)和英文数据集(WSJ)上的准确性3.写出实验分析报告(不同数据集下,不同模型下结果对比分析)了解名词作为刚入门的小白,对NLP中很多名词一无所知。所以在实操之前,我决定先肢解任务要求,对里面提到的每一个陌生名词都进行解释...
摘要由CSDN通过智能技术生成

NLP词性标注笔记(一)

任务要求

1.利用HMM、MEMM、CRF、Perception训练词性标注任务
2.分别计算每个模型在中文数据集(CTB5,gsd_simple)和英文数据集(WSJ)上的准确性
3.写出实验分析报告(不同数据集下,不同模型下结果对比分析)

了解名词

作为刚入门的小白,对NLP中很多名词一无所知。所以在实操之前,我决定先肢解任务要求,对里面提到的每一个陌生名词都进行解释:

  1. HMM模型 :隐马尔可夫模型,一个统计模型,用来描述一个含有隐含未知参数的马尔可夫过程。难点是从可观察的参数中确定该过程的隐含参数,然后利用这些参数作进一步分析。
    两个假设
    输出观察值之间严格独立;
    状态的转移过程中当前状态只与前一状态有关(一阶马尔可夫模型)
    HMM模型假设前提使该模型适用于比较小的数据集。因为在大量真实语料中,观察序列更多是以一种多重的交互特征形式表现,观察元素之间存在相关性。在命名实体识别的任务,因为实体本身具有复杂结构,所以需要复杂的特征函数来涵盖所有特性。但是HMM的假设前提使它无法使用多于一个标记的特征。

    马尔科夫链之转移概率:从前一个状态进入当前状态的概率;
    隐含马尔可夫链之生成概率:每个状态产生相应输出符号的概率;
    转移概率和生成概率被称为隐含马尔可夫模型的参数

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值