标注方式,就决定了解码方式,如何做标注,决定了训练时候的比对,决定了预测的时候如何做解码。
信息抽取定义
信息抽取应用
实体关系事件
包括问答也是,有抽取式和生成式
评测指标
解码是关键
实体抽取
CRF让输出也关联合理
重叠
不连续
关系抽取
两步走关系抽取
关系就是一个分类任务
序列标注直接解决关系抽取
关系重叠
分头实体和尾实体进行区分,这个就是实践课的多标签分类问题
变换为整体的分类,实体对的组合,先预测所有头实体,然后输入和头实体结合为特征去预测所有尾实体,起始位置和结束位置,带关系
统一的最新方案,不是一个字标一个类别,而是两两字进行组合标相关的类别的头和尾,如果不存在类别就标空。一次把所以的标注出来
其他问题
总结
事件抽取,多个分类
4-1 理论课:信息抽取技术及应用
最新推荐文章于 2024-06-26 12:41:14 发布