目录 摘 要 第一章 引言 1.1研究背景 1.2研究意义 第二章数据预处理 2.1问题描述 2.2数据预处理 第三章一致性和差异性检验 3.1文章是否淘汰的计算 3.2各维度平均分的计算 3.3一致性和差异性检验及结果分析 3.3.1 ICC 组内相关系数 3.3.2 Kendall 协调系数 3.3.3 Bland-Altman 图 3.3.4 Pearson 相关系数 3.3.5 方差分析 3.4对比结果可视化展示 第四章基于文本向量空间的特征词词库的构建 4.1数据准备 4.1.1 数据描述 4.1.2 数据预处理 4.1.3 数据可视化 4.2构建特征词典的方法介绍 4.2.1 基于 TF-IDF 系数构建特征向量空间 4.2.2 基于 Kmeans 聚类算法构建特征词典 4.2.3 基于 LDA 主题模型扩充特征词典 4.2.4 构建特征词典 4.3基于 SnowNLP 库建立打分评价模型 4.3.1 情感分析理论 4.3.2 计算情感得分 4.3.3 基于已知的四个维度进行评分 第五章基于评阅专家观点评价模型的评价 5.1可视化评分 5.2一致性检验 5.3误差分析 5.4典型特征分析 第六章总结 参考文献 代码实现 特征词词典的构建 各个维度的评分计算 摘 要 随着我国高科技人才的需求不断扩大,我国研究生招生人数也因此逐年增加,研究生的 毕业论文成为了检验研究生是否能够顺利毕业的重要标志,通过评审专家对研究生学位论文 给出合理的评分和修改建议,通过评分来展示学位论文的水平和质量。 针对问题 1 ,进行数据预处理之后,根据题目要求筛选出问题论文。首先提取 3