帮你的英文写作一键纠错,微软升级版AI批改软件有这些亮点

543 篇文章 14 订阅
251 篇文章 16 订阅

你的英语还好吗?

学英语时,“听说读写”是四大核心要素, 而“写”可谓是英语学习中最考验学习者综合语言运用能力的一项。

在写作的时候,你会面临写错、单词匮乏以及语法错误等诸多问题,但如果让你自己或者找别人修改又是一件费时费力的事。

但现在,通过NLP、OCR(光学字符识别)等领域的技术加持,很多公司推出了AI批改软件,帮你你轻松解决英文写作的问题。

微软亚洲研究院于2016年发布的个性化英语学习助手微软小英,用 AI 技术帮助用户解决“听”和“说”难题的软件。对于“写”的问题,微软亚洲研究院在2018年将“作文打分”功能嵌入了微软小英,并在去年年底对该功能全面升级,推出了微软“爱写作”网页版。

近日,微软“爱写作”公众号正式上线,基于微软亚洲研究院在自然语言处理、OCR(光学字符识别)等领域的多项最新研究成果,以及微软小英多年的技术积累,“爱写作”打造了四大亮点:语法检查、词语替换、分类作文打分和手写图片识别。它可根据不同年级的作文标准,从语法到用词、文章结构,帮助小初高学生、成人培训学习者,以及四六级、雅思、托福、考研的备考者提升英文写作水平。

PC端体验网址:
https://aka.ms/zuowen

语法检查讲解

语法检查是作文批改中最基本的核心功能。学生只需点击红线,就能获得有针对性的语法讲解,并且还可以看到修改后的正确表达,作为参考,让学生们不仅知错就改,而且知道如何去改。
在这里插入图片描述

“爱写作”的语法检查功能采用了微软亚洲研究院此前提出的全新的学习和推断机制Fluency Boost Learning and Inference(流畅度提升学习与推断),帮助用户“找茬”。通过 Fluency Boost Learning(流畅度提升学习)生成的大量纠错数据,结合 seq2seq 预训练技术(相关论文:https://arxiv.org/abs/1909.06002),“爱写作”的语法纠错模型在 CoNLL-2014 和 JFLEG 两个权威语法纠错数据集上保持着业界领先的技术水准。

“高级”词语替换

针对这一问题,“爱写作”的词语替换功能可以根据上下文筛选出多个高级词汇供用户选择使用。针对某个特定的词或短语,“爱写作”可以自动关联三个同义词作为备选,让用户不再只会用“good”、“nice”这样的简单词汇,而是能够看到更多的如“impressive”、“admirable”这样更复杂的词汇,来进行替换。
在这里插入图片描述

在词语替换功能中,微软亚洲研究院的研发人员提出了基于预训练语言模型的词替换方法(相关论文:https://www.aclweb.org/anthology/P19-1328.pdf),并结合微软原创的预训练语言模型——UniLM(https://github.com/microsoft/unilm)作为词替换的解决方案。该方法通过半遮盖(partial masking)等策略让预训练语言模型能够同时考虑原目标词词义以及上下文语境,从而选出合适的替换词。

个性化作文评分,覆盖8大考试类型

基于此前微软小英“作文打分”功能和“爱写作”网页版积累的丰富经验,升级后的“爱写作”作文打分功能更加强大,不仅可以对所有文章进行一般性评分,还可以测试同一篇作文在不同考试类型中的得分状况。因为不同的考试在词汇、语法、文章结构、连贯性、切题程度等维度上对作文有不同的考量标准,所以“爱写作”在给出分数的同时,还可以有针对性地评价一篇作文在上述这些维度上的表现,并给出反馈建议,以便学生更好地进行自我提升。目前,“爱写作”支持小学、中考、高考、四级、六级、考研、托福、雅思共八大英语考试类型。
在这里插入图片描述

作文打分本是一种主观行为,要转化为机器打分,则需要大量有标注的数据才能准确打分,而且还需要将作文精确对应到10分还是20分,亦或是15分。“爱写作”使用了微软亚洲研究院研发的序数回归模型(Ordinal Regression),大大减少了对标注数据量的依赖。该技术把“文章与具体分数的匹配”问题,变成了一个有序的比较大小的问题,在训练过程中,将已有的标注数据两两配对进行对比,进而形成新的文章与评分,再将此数据加入到标注数据集中,使得可用于训练的标注数据量呈指数级增加,从而整体提高了评分的准确性。
在这里插入图片描述

手写图片识别,将手写文章转化成电子文档

只需用手机给作文拍照并上传,“爱写作”就能分分钟将其转换成可用智能终端进行编辑的文字,语法检查、作文打分、词语替换等等作文批改功能全部轻松实现。而且,老师们也可以借助此功能,轻松识别学生们各不相同的手写字体,方便完成作文批改工作。

微软亚洲研究院研发的微软新一代 OCR 引擎为“爱写作”中的手写识别功能提供了技术支撑。微软新一代 OCR 引擎像“鹰眼”一样,可以有效地检测出图像中的各类文字,还可以同时支持打印体和手写体的复杂文字场景识别。

在这里插入图片描述

除了上述四大亮点,“爱写作”还支持中英文双向的查词功能和逻辑连接词的查找功能,用户再也不需要退出应用到专门的词典里进行查询,使用更加简便、高效。

未来,语法自动检查及纠正这一自然语言处理领域的经典任务将应用在英语写作之外的更多应用场景(如电子邮件、PPT 演示文稿、翻译文件等文档撰写),更智能地帮助人们在写作中规范语言使用,辅助人们进行内容创作。

以下为媒体与微软亚洲研究院微软亚洲研究院资深开发经理夏炎、研究工程师王泽华的对话内容:

媒体:爱写作在文章结构理解上表现如何?

微软:现在爱写作在打分的过程中会参考不同的维度,结构也是维度之一。也就是说,我们现在的打分可以反映出文章结构上的优劣程度。从批改的角度,目前爱写作还没有给出具体的建议可以把结构调整一下,但这是我们未来的一个发展方向。

媒体:除了爱写作外,现在市面上其他公司也推出了这种免费的AI写作软件,在语法检查等功能背后的算法方面,你们自己的算法特点是怎样的?

微软:我们研究员两年前发表feature文章去做语法检查模型的论文之前,我观察到市面上一些批改的工具或者网站分两种。

一种是基于规则的批改。基于规则的批改,它的好处是基本上会批改的比较准。如果它找到了一个问题,这个问题大概率会是一个真正的问题。但是,它不好的一点是规则越来越复杂,越来越庞大,最后它的覆盖率,比如一篇作文有10处错误,它能找出几处?一般来说,它可能只能找出1、2处,或是2、3处。这是我们在推出算法模型之前市场上我观察到的一些产品的特点。另外一种是人工,需要付费,而两年前我们推出的算法的批改从准确率和覆盖率上都是非常高的。

作为微软亚洲研究院和爱写作团队,我们的一个优势是跟研究员有非常深入的合作,研究员最新的研究成果,他们的模型和算法都可以很快的放到我们爱写作产品里。

媒体:爱写作网页版的用户反馈如何?

微软:爱写作网页版在2019年底推出以后,已经有很多用户在用了。我们在微信上有一个粉丝群,用户会在里面和我们进行讨论或者提出问题。数据一直是在增长的,但目前还在统计中,不过现在作文提交已经有几十万篇了。

媒体:爱写作未来的发展规划是什么?有没有考虑推出一些付费功能或做一些商业化运作尝试?

微软:微软小英自2016年推出至现在都是免费的,爱写作应该也会一直免费。我们的目的不是推出一个教育产品去赚钱,更多的是想去探索AI的技术如何应用在教育场景中,帮助学生、老师和家长。同时,我们也希望与更多不同领域的机构进行合作,探索AI+教育的合作点,更好地理解教育行业、理解用户,从而共同解决中国英语学习者在移动和人工智能时代的需求。

媒体: 和教育培训机构合作,你们更倾向于哪些具体合作方式?

微软:微软上线爱写作,一个优势是我们微软的老本行是做平台和做技术的。我们不想通过这样的方式去盈利,我们更多的还是想把我们的技术能够提供给我们的合作伙伴,可以去赋能他们现有的产品,对他们现有的服务流程去进行优化,这是我们定位上的一个优势。

我们希望将技术应用在更多场景下。微软始终是以技术导向为主,AI是我们的强项,但我们不是教育理念和教育内容上的专家,而教育机构有很强的专业性、权威性。这也是为什么我们希望可以跟专门做教育的公司展开合作,双方共同去探索AI在教育领域的应用。比如之前我们与培生合作推出“朗文小英”,就是以人工智能技术赋能个性化英语学习。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值