big code: code2seq论文复现 Generating Sequences from Structured Representations of Code

本文介绍了对code2seq模型的复现过程,数据预处理包括处理方法名和AST路径,数据加载器针对多维度数据进行填充和排序。模型使用双向LSTM编码AST节点,对路径和token进行表示,并通过注意力机制进行解码。实验结果显示,复现模型在性能上与原论文存在差距。
摘要由CSDN通过智能技术生成

这个代码其实是别人写的pytorch的实现:GitHub

code2seq复现

数据

test|reset test,Nm0|MarkerExpr|Mth|Void1,void test,Nm0|MarkerExpr|Mth|Nm2,METHOD_NAME void,Void1|Mth|Nm2,METHOD_NAME

数据按行存,通过空格分隔开。其中,第一项test|reset是方法名,用竖线|分隔为subtoken,其余的项是AST PATH

AST PATH由三个部分组成,通过逗号,分隔开。

第一项和第三项是AST PATH开始的token和结束的token,通过竖线|分隔为subtoken

第二项是AST PATH中的结点,也通过竖线|分隔。

with
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值