【论文翻译】CodeXGLUE: A Machine Learning Benchmark Dataset for Code Understanding and Generation
基准数据集可以显著促进在编写程序语言任务方面的研究。在这篇论文中我们介绍了CodeXGLUE,这是一个基准数据集,用于促进“程序理解和生成”的机器学习研究。CodeXGLUE包含 14个数据集上的10个任务,以及一个用于模型评估和比较的平台。CodeXGLUE还具有三个基准线系统,包含BERT风格,GPT风格和Encoder-Decoder模型,以此使研究者更容易使用该平台。这些数据和基准线可以帮助开发和验证那些被应用到各种程序理解和生成问题中的新方法。在本节中,我们为每个任务提供一个定义。
翻译
2024-02-29 13:33:25 ·
185 阅读 ·
2 评论