结构化数据和输出文本之间对齐

重新看了HSMM代码,发现该模型的对齐过程是,直接从输出中找到输入中出现的词。如果没有出现,代码中会将之置为null。

有很多文章专门研究如何进行输入输出之间对齐的问题。最近看了三篇文章,简单记录一下

一、Learning Semantic Correspondences with Less Supervision

semantics-acl2009.pdf (stanford.edu)

基础。后面的文章都是针对这篇文章的改进。

用了三个级联的HMM学习

二、Learning Latent Semantic Annotations for Grounding Natural Language to Structured Data

论文&代码

这篇文章的工作可以理解为弱监督学习中的语义解析器,给一个句子,学习句子中的实体或者标签。

文章的亮点在于可以更好的学习如下几种类型的关系映射:

  1. 数字-数字:由于习惯会对数字进行一些变化,(个人理解类似四舍五入或者取整操作)
  2. 字符串-字符串:由于习惯会对字符串进行一些变化(个人理解类似简称、昵称)
  3. 类别-字符串:可枚举的或者专有名词,比如星期天,职位
  4. 数字-字符串:3km→ 三千米

三、Data2Text Studio: Automated Text Generation from Structured Data

感觉这个就是我们最开始想要的那种界面工具:

  1. 可以自己选择槽位
  2. 可以自己写比较逻辑

核心亮点是可以自动学习出trigger。但是目前仅限于两个数直接的相减操作。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值