对SemEval 2015 Task 18: Broad-Coverage Semantic Dependency Parsing的理解

最新推荐文章于 2023-03-17 10:30:47 发布

yangshi1111

最新推荐文章于 2023-03-17 10:30:47 发布

阅读量1k

点赞数

分类专栏：论文理解文章标签：语义依存分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangshi1111/article/details/79530965

版权

新手入门，请多理解，本文原博主 yangshi1111

主要讲和14年那篇论文不一样的地方
除了WSJ of PTB 的英文资源，还使用了中文和捷克语资源
关于和其他三个子任务的比较已经在14年的那一片paper中简述了，没有什么太大的区别

关于三种表示，DM表示和上文没什么区别，PAS表示除了使用英文资源还利用同样的技术使用了Penn Chinese Treebank(CTB) 的中文资源。在15年中将PCEDT换了一个名字，叫做PSD，但都是使用了t-树的语义依赖关系

SDP的目标表示依旧是图表示，图中的节点，除了词，词干，词性和flag标志，还多了一个可选的帧信息例如使意谓词和起始谓词的关系，边依旧表示语义依存关系。对应的，提供的数据也比以前多了一列表示帧信息。

数据集依旧使用了WSJ 语料库，并在语句和单词层面上做了同步并排除了一些不好的数据，如缺乏黄金标准分析，无法对齐(缺少词干，词性)，存在环路等。最后排除掉不好的数据后，我们选择了35657条句子作为训练数据，1410条域内句子和1849域外句子作为测试数据。
除了额外的域外测试数据和帧信息外，我们为了一些表示还包括了其他语言，我们选择了31113条额外的中文语句作为PAS目标表示的训练数据，42076条捷克语作为PSD的训练语句，此外对于这些额外的语言，我们还别进行了域内域外测试。
统计对比：
PAS: 更小细颗粒度(1)且标签更少，拥有更多的边(3)
DM: 单节点比较多(2)，DM有不少无top顶点的分立的图，有提高空间()
PCEDT: 单节点比较多(2), 将出现频率高的限定词(determiner,

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
对SemEval 2015 Task 18: Broad-Coverage Semantic Dependency Parsing的理解

新手入门，请多理解，本文原博主 yangshi1111 主要讲和14年那篇论文不一样的地方除了WSJ of PTB 的英文资源，还使用了中文和捷克语资源关于和其他三个子任务的比较已经在14年的那一片paper中简述了，没有什么太大的区别关于三种表示，DM表示和上文没什么区别，PAS表示除了使用英文资源还利用同样的技术使用了Penn Chinese Treebank(CTB) 的中文...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。