2020 CCF BDCI小学数学应用题自动解题解题思路

简单说几点这个题目的看法:

1、此题用苏剑林开源的 生成模型来做 大概得分就是我们的现在的得分

BERT可以上几年级了?Seq2Seq“硬刚”小学数学应用题 - 科学空间|Scientific Spaces​spaces.ac.cn/archives/7809正在上传…重新上传取消

2、然后要通过一些后处理方式 把答案加以修正

(1)比如答案是什么类型的 几分之几的 问的是利率的 问的是小数的 等等分数就可以上一点

3、此题最大的问题是合规问题,官方没有给出标记的表达式,导致大家都只能去用ape数据集 然后就开始堆模型

不过我们试验了 堆模型效果并不理想,通过仔细观察 如果题目的语序变一下之后 他的预测结果就不稳了

4、另外提供一个思路 我们认为把表达式 标记成方程要好预测一些 毕竟方程短一些 并且更加直观 但是很费人工

5、对于第4点 要注意 前后题目的方程必须要统一,比如鸡兔同笼问题不能 一道题目设置鸡为x 一道题目设置兔为x 这样数据就混乱了 不利于训练模型

6、另外现在的预训练模型 其实对于句法的结构并不敏感 学到的更多的还是 词语的意思

7、事情研究到这里 ,暂时没有太大价值 继续

这里贴一下成绩:

8、可能现在人工智能还达不到自动解题的程度

北京智源人工智能研究院:智源深度 | NLP 面临的三大真实挑战(含视频)21 赞同 · 0 评论文章正在上传…重新上传取消

个人感觉人在思考问题的时候 联结主义和 符号主义是间断存在的 现在深度网络的方法应该只模仿了人脑的功能区。

9、其实生成的方法有个问题:本来一个题目的表达式其实有多种写法,比如加法乘法有交换律结合律,也就是数字在这种情况下是不区分前后的,但是标签只能标一个,两个表达式必定有一个对 一个错 (其实都对),这里定义loss就有一个问题,能不能定一个,loss两个都对?

请教大家这个问题

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值