- 博客(4)
- 收藏
- 关注
原创 基于Python的简易文本分析程序
考生将题目、两份作文输入程序后得到一份评分报告。评分报告给出以百分数为形式的数据为考生提供修改建议。考生输入文本后,评分报告以pyGUI的形式呈现给用户,显示各类指标、图表和建议。情景假设:一位考生根据题目要求写出了一份作文,考生略做修改后提交第二份文档,实现功能:该项目主要关注以下几点:主题契合度、词汇高级度、查重率与体检报告。
2023-06-23 10:48:19 796 1
原创 主题契合度的量化——基于TF-IDF算法及Rearrangement Inequality
笔者定义the_total_score_of_keyword函数,以需要摘要的新闻(topic),分别对考生写下的第一篇文章(text1)与考生以第一篇为基础修改得到的第二篇文章(text2)关键词词频进行计算,求得text1与text2的得分,将(1-text2/text1)作为该考生文章修改后,关键词复现词频得分提高的比例。通过tkinter界面的数据接口,传入三篇文章,分别为:需要摘要的新闻(topic)、考生写下的第一篇文章(text1)与考生以第一篇为基础修改得到的第二篇文章(text2)。
2023-06-10 17:44:50 218
原创 文本分析——基于TF- IDF&SimHash Hamming
文本分析功能模块之一:基于TF- IDF&SimHash Hamming岭南学院大作业--Ym kingOfCoding组
2023-06-07 17:06:29 257 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人