TransRepair：自动测试及修复神经网络翻译模型的不一致性问题

AITIME论道

于 2020-08-20 19:28:00 发布

阅读量977

点赞数 1

文章标签：人工智能大数据 python 机器学习深度学习

本文链接：https://blog.csdn.net/AITIME_HY/article/details/108138836

版权

TransRepair是针对机器翻译模型不一致性问题的一种自动测试和修复方法，结合变异测试和蜕变测试，通过黑盒和灰盒修复技术来检测和修复神经网络翻译器中的错误。该方法在无需源代码和额外训练数据的情况下，能有效识别和改善翻译不一致性，提高翻译质量和一致性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

⬆⬆⬆ 点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

机器翻译是计算语言学的一个分支，是人工智能的终极目标之一，具有重要的科学研究价值。同时，机器翻译又具有重要的实用价值。随着经济全球化及互联网的飞速发展，机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。

机器翻译虽已广泛应用于各个领域，但现有神经网络测试工作均未在自然语言处理的模型上进行过测试。然而，研究发现在这些翻译模型中存在不一致性问题。发表于ICSE 2020的论文《Automatic Testing and Improvement of Machine Translation》率先对机器翻译进行测试，并提出了一种用于检测及修复神经网络翻译器中所存在的不一致性问题的方法——TransRepair。

TransRepair结合了变异测试及蜕变测试两种方法以检测不一致性问题。对于所检测的问题，提出了一种基于概率的后处理方法以对该问题进行修复。本期AI Time PHD直播间，我们很荣幸地邀请到论文的一作，北京大学孙泽宇博士为大家分享他们的研究成果！

孙泽宇，北京大学信息科学技术学院2019级博士生，导师为张路教授，指导老师为熊英飞研究员。主要研究方向为程序自动生成和软件测试，已在相关领域的国际顶级会议如ICSE, AAAI, IJCAI, FSE等发表多篇论文。

一、研究动机：机器翻译的不一致性

随着机器学习的发展，多用途的自然语言翻译系统相继问世，许多系统能够实时有效地在数千种语言之间进行翻译。然而事实上，大多翻译系统并不完美，存在大量翻译上的错误。

研究发现，人为的误译可能造成非常严重的后果，成为改变历史的导火索。例如，19世纪末著名的《乌查里条约》误译事件。由于意大利对条约第17条错误的翻译，最终导致了意大利和埃塞俄比亚两国爆发战争。

同样，机器翻译的误译也会造成困惑及误解。例如，将传统小吃“四喜烤夫”翻译成“roasted husband”，将“小心滑倒”译为“slip and fall down carefully”等。更为严重地，出现不公平性现象，对特定的用户群体造成伤害。图1显示了几个语言对（英语→中文）的谷歌翻译结果，当主语是“men”或“male students”，将“good”翻译成“很好的 (very good)”，然而当主语是“women”或“female students”时，则将“good”翻译成“很多 (a lot)”，这种不一致性不仅会让用户感到困惑，而且显然对计算机科学领域的女性研究人员也不公平。与进行“very good”研究相比，进行“a lot”研究明显是一种更具贬义的解释。为了避免这种翻译错误，需要能够自动识别和纠正不一致性的技术。