主观题自动评阅初步实现—week1

PeikLong

于 2019-11-22 20:57:16 发布

阅读量2.8k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39591838/article/details/103207138

版权

该博客介绍了如何实现主观题自动评阅，主要思路是从段落到句子再到词汇的相似度计算，使用分词和停用词表处理，通过序列对匹配算法初步评估词语相似度，后续计划改进。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

通过阅读相关论文，总结实现的大致思路：（论文原文链接：https://www.docin.com/p-1845286785.html）

　　先设学生给出的答案和标准答案均为两段中文段落，我们的目的是计算出这两个中文段落的相似度，而中文文本一般由段落组成，段落根据标点符号可以划分成句子，句子根据分词可以划分成词汇，由此根据两个句子中词汇的相似度计算出句子的相似度，再根据句子的相似度计算出段落的相似度，然后根据段落的相似度计算出文本的相似度。

　　首先将句子通过分词划分成多个词语的集合，并通过停用词表去掉没有意义的词语，设两个句子S1和S2分词后的词语集合分别为S1：{W11,W12,.....W1m}和S2：{W21,W22,.....W2n}，由此得出两个句子的相似度矩阵MS，其中W1iW2j是句子S1中的词语W1i和句子S2中的词语W2j的相似度。

　　在计算句子相似度时，首先取矩阵中的最大值MS1放入序列maxMS中，然后将此最大值所在的行和列删除，形成新的矩阵，重复此过程直到矩阵为空，得到最大值序列maxMS。则两个句子的相似度可以通过对maxMS求合并除以S1，S2词语长度的较大值得到。

　　而为了计算两个词语的相似度，可以通过python的gensim包实现，但实践的时候发现效果并不理想，它创建的模型可能是基于统计的方法而非语义理解，所以暂时先用序列对匹配算法直接进行文本的匹配，从而得到两个文本或词语的相似值，后面再用其他方法替换序列对匹配算法对词语进行相似度匹配，序列对匹配算法实现如下：

最低0.47元/天解锁文章

博客等级

码龄8年

39
原创

43
点赞

149
收藏

37
粉丝

关注

私信

最新评论

主观题自动评阅实现—week2
m0_63029859: 想问下您找到了吗，能交流下吗
主观题自动评阅实现—week2
小源1108: 没有找到欸
主观题自动评阅实现—week2
求心不求佛: 请问你找到了吗？我也在找，交流下
主观题自动评阅实现—week2
小源1108: 你好我想请问你有没有这种简答题学生答案，标准答案，最终得分的数据集呀？
主观题自动评阅实现—week2
vivisol: 这个好像也没有办法判断“肯否问题”，只判断语义相似性的话，它会认为原命题和否命题是等价的，

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。