python编程题自动评分系统_基于TFIDF及LSI模型的主观题自动评分系统研究

本文研究了一种基于TF-IDF和LSI模型的主观题自动评分系统,利用jieba进行中文分词预处理,用Python实现。通过对考生答案与标准答案的语义相似度分析,系统能对主观题进行批改和评分。实验结果显示,该系统在一般情况下能有效自动评分,是一种可行的方法。
摘要由CSDN通过智能技术生成

2

COMPUTER ENGINEERING & SOFTWARE

国际

IT

传媒品牌

作者简介

:

周洲

(1992

)

,男,研究生,主要研究方向:自然语言处理,企业信息化集成;侯开虎

(1971

)

,男,教授,主要研究方向:

企业信息化工程,服务运作系统工程;姚洪发

(1991

)

,男,研究生,主要研究方向:自然语言处理;张慧

(1993

)

,女,研究生,主要研究

方向:企业信息化集成。

基于

TF-IDF

LSI

模型的主观题

自动评分系统研究

周  洲,侯开虎,姚洪发,张  慧

(昆明理工大学

机电工程学院,云南

昆明

650000

)

:

随着计算机辅助教学,

多媒体处理以及计算机网络技术的发展与成熟,

目前已经有许多考试都采用无

纸化考试,即机考的形式进行。采取电子化考试的优点在于考试可监控性强,考试效率高,考试标准化和程序化。

并且对于选择题判断题这样的客观题自动化批改技术已经十分成熟,极大的缩减了改卷时间,提高了改卷效率。但

是,由于受到自然语言理解的限制,至今没有比较完善的主观题自动批改系统对主观题进行批改和评分。本文采用

TF-IDF

LSI

两种模型作为文本分析模型,

使用

jieba

中文分词工具进行文本预处理,

使用

Python

语言实现该系统。

通过考生答案与标准答案的语义相似度分析,对考生作答的主观题进行批改和评分。之后随机抽取

5

份大学考试中

的考生试卷,

使用该主观题自动评分系统进行测试,

与改卷老师所给出的评分进行对比分析和说明。

实验结果表明,

本文所提出的主观题自动评分系统在一般情况下可以满足主观题自动评分的功能,

是一种值得继续深入研究的可行

方法。

关键词

:

无纸化考试;主观题;自动评分;

Python

TF-IDF

LSI

中图分类号

:

TP311.1

文献标识码

:

A

DOI

10.3969/j.issn.1003-6970.2019.02.031

本文著录格式:

周洲,侯开虎,姚洪发,等

.

基于

TF-IDF

LSI

模型的主观题自动评分系统研究

[J].

软件,

2019

40

(

2

)

158

163

Research on Automatic Scoring System of Subjective

Questions Based on TF-IDF and LSI Model

ZHOU Zhou, HOU Kai-hu, YAO Hong-fa, ZHANG Hui

(

Department of Industrial Engineering, Faculty of Mechanical and Electrical Engineering,

Kunming University of Science and Technology, Kunming

650000,

Yunnan, China

)

Abstract

:

With the development and maturity of computer aided instruction, multimedia processing and computer

network technology, many examinations have been conducted in the form of paperless tests, that is, computer tests.

The advantage of electronic examination is that it can be monitored well, the efficiency of examination is high, the

examination is standardized and programmed. And for the multiple choice judgment questions such as automatic

marking technology has been very mature, greatly reduced the time to correct the paper, improve the efficiency of

paper

correction. However, due

to

the

limitation

of

natural

language understanding,

there

is no perfect

automatic

subjective question marking system. In this paper, TF-IDF and LSI models are used as text analysis models, jieba

Chinese

word

segmentation

tools

are

used

for

text

preprocessing,

and

Python

language

is

used

to

implement

the

system.

By

analyzing

the

semantic

similarity

between

the

test

answers

and

the

standard

answers,

the

subjective

questions are corrected and graded. Then 5 college examination papers were randomly selected and compared with

the real scores of teachers. The experimental results show that the automatic scoring system of subjective questions

proposed

in

this

paper

can

meet

the

function

of

automatic

scoring

of

subjective

questions

under

general

circum-

stances and is a feasible method worthy of further study.

Key words

:

Paperless test; Subjective questions; Automatic scoring; Python; TF-IDF; LSI

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
基于TF-IDF的问答系统是一种利用TF-IDF算法来实现自动问答功能的系统。TF-IDF(Term Frequency-Inverse Document Frequency)是一种常用的文本特征提取方法,通过计算关键词在文本中的重要性来衡量其在整个集合中的重要性。 该问答系统的基本原理是将输入的问题与预先准备好的文本语料库进行匹配,选取与问题最相关的文本作为答案。首先,对语料库中的每篇文档进行预处理,包括分词、去掉停用词等操作。然后,计算每个词在每篇文档中的TF-IDF值,得到一个文档-词的TF-IDF矩阵。接着,对输入的问题进行同样的预处理,计算问题中每个词的TF-IDF值。 在匹配阶段,系统会将问题的TF-IDF向量与文档库中的每篇文档的TF-IDF向量进行相似度计算,常用的计算方式是余弦相似度。相似度较高的文档被认为是问题的答案,并按照相似度降序排列。最后,根据问题的特点,可以选择返回一个最相关的答案,或者返回若干篇相关度较高的文档供用户选择。 基于TF-IDF的问答系统有一定的优势,它能够根据问题的关键词选择最相关的答案,并且可以处理大规模的文本语料库。然而,它也有一些限制,例如不能处理含有复杂语义的问题,对于文本的理解和推理能力较弱。 总的来说,基于TF-IDF的问答系统可以作为一个简单的问答工具,但如果需要更高级的问答功能,可能需要引入其他算法或模型来进一步提升系统的准确性和智能化程度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值