2012年国赛A题论文研读

前言

2012A题是很典型的评价类问题,论文中涉及到许多的常规处理办法。本文以整理这些方法的思路为主,对题目只做简要的分析。有一些方法的资料是原文摘录的,会在段落开头给出来源。

问题

题目主要是对葡萄酒的评价,有4问:

  1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信
  2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级
  3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系
  4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

加粗部分就是题目中的要点,下面逐一分析。

论文思路和方法

Wilcoxon 符号秩检验法:两组评价结果的有无显著性差异

Wilcoxon 符号秩检验法用于判断两个样本是否来自相同的或相等的总体。可以用于同一研究对象分别给予两种不同处理的效果比较。在本例中因为两组品酒员分别对同一样本组进行评分,故两组数据为配对数据。对于两组配对数据的检验,需要引入适用于T检验中的成对比较。如果不要求成对数据之差服从正态分布,只要求对称分布,则使用Wilcoxon 符号秩检验法。其检验步骤(以红葡萄为例)如下(来自国赛论文):
在这里插入图片描述
在这里插入图片描述

秩相关分析评价:判断对某种事物的主观评价是否(更)可靠

秩相关分析评价模型用肯德尔和谐系数判断对某种事物的主观评价是否可靠。
肯德尔和谐系数是指“以等级次序排列或以等级次序表示的变量之间的相关”,它常用来刻画多个评价者对某一事物评判或评分的一致性程度。
假设有M人对J个评价对象评分。
步骤如下:
Step1.将评分表中的数据进行秩变换,即把每个评价人员对各个被评要素的评分按顺序排号,化为等级分。
Step2.计算和谐系数
在这里插入图片描述
r m j r_{mj} rmj是第 m m m个人对第 j j j个评价对象的评分秩
当评价者分歧较大时, R j ( j ∈ [ 1 , J ] ) R_j(j∈[1,J]) Rjj[1,J]之间的差别较大,当评价者分歧较小时, R j R_j Rj之间的差别较小。
M ⩽ 20 M\leqslant 20 M20,且 J ⩽ 7 J\leqslant 7 J7,属小样本,计算除Q后和肯德尔一致性系数临界值表对比,若大于等于临界值,认为意见一直,否则认为不一致。
M > 20 M>20 M>20,且 J > 7 J>7 J>7,属大样本检验统计量为,服从自由度为 J − 1 J-1 J1的分布,若的计算值大于等于给定显著性水平的临界值,则认为不可靠。
如果是比较几组人哪一组的评价更可靠,那么,较小的一个更可靠。
下表为肯德尔一致性系数临界值表,其中k是人数,n是评价对象个数。
在这里插入图片描述

判断正态分布

对两组评价差异性的假设检验一般要求数据符合正态分布,这里补充了判断正态分布的方法。

P-P图和Q-Q图:直观判断

【摘自https://zhidao.baidu.com/question/182879807.html】
P-P图和Q-Q图主要用来判断正态分布。P-P图和Q-Q图的目的性基本一致,但原理上有着区别。
P-P图,其原理在于如果数据正态,那么数据的累积比例与正态分布累积比例基本保持一致。分别计算出数据累积比例,和假定正态时的数据分布累积比例;并且将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图。
在这里插入图片描述

Q-Q图,其原理在于如果数据正态,那么其假定的正态分位数会与实际数据基本一致。计算出假定正态时的数据分位数;并且将实际数据作为X轴,将假定正态时的数据分位数作为Y轴,作散点图。 无论是P-P图,或者Q-Q图;如果说数据呈现出正态性,那么散点图看上去应该近似呈现为一条对角直线,此时说明数据呈现出正态性。如果散点图看上去明显不是一条直线,那么说明数据很可能不具有正态特质。
在这里插入图片描述
P-P图和Q-Q图均可使用SPSSAU在线分析软件生成,两者功能一致看使用偏好选择即可。

单样本K-S检验:计算判断

【摘自https://max.book118.com/html/2017/0217/92277468.shtm】
单样本K-S检验(用于检验单一样本是否来自某一特定分布的方法)它的检验方法是以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。
假设检验问题:
H0:样本所来自的总体分布服从某特定分布
H1:样本所来自的总体分布不服从某特定分布
F 0 ( x ) F_0(x) F0(x)表示理论分布的分布函数, F n ( x ) F_n(x) Fn(x)表示一组随机样本的累计频率函数。D为F0(x)与Fn(x)差距的最大值,即 D = m a x ∣ F n ( x ) − F 0 ( x ) ∣ D=max|F_n(x)-F_0(x)| D=maxFn(x)F0(x)
当实际观测D>D(n,α)(D(n,α)是显著水平为α,样本容量为n时,D的拒绝临界值),则拒绝H0,反之接受H0。
D(n,α)如下表。
在这里插入图片描述

多级的评价体系:评分或定级

如本例: 这里是三级,每个指标在对应的一级里用层次分析法AHP计算权重。
在这里插入图片描述

一致化和无量纲化:数据预处理

在构建线性评价体系的时候,对数据要进行预处理
在这里插入图片描述
在这里插入图片描述

典型相关分析法:两组指标间的关系

这里只列一个简单的步骤,详细可以参考(《数学建模算法与应用第2版》司守奎,孙兆亮)
Step1.建立原始矩阵(参p273),并求出对应的标准化数据阵
Step2.计算两组变量的协方差矩阵并分块(参p269)
Step3.求出多对典型相关系数和典型变量(参p270,通过求M1和M2矩阵的特征根和特征向量)Step4.检验各对典型相关系数的显著性(参p274)

多元回归及其检验:论证某些指标(多个)能否反映单个指标

Step1.从N个样本中随机选择n(n<N)个用于分析。
Step2.如果指标过多,可以通过主成分分析等对指标进行降维。
Step3.应用筛选出来的指标去和单个指标建立多元回归模型。
Step4.用剩下的(N-n)个样本,对多元回归方程进行验证。这里可以使用Wilcoxon 符号秩检验法判断用多元回归方程得到的结果和参考结果是否一致。
Step2.中如果指标不太多,或者这个任务不是建模的主任务,也可以使用逐步回归分析。 回归模型的建立方法如下(来自国赛论文):
在这里插入图片描述
多元线性回归模型如下(来自国赛论文):
在这里插入图片描述
在这里插入图片描述

资料

论文,题目,代码,数据

  • 2
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。 首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合 数据分析,发现对于红葡酒有 的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。为了评价两组结果的可信度,借助Alpha模型用克伦巴赫 系数衡量,并结合 检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。综合来看,主观因素对葡萄酒质量的评价具有不确定性。 结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚分析法,利用SPSS软件对葡萄酒样进行分,根据分的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。 为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。 由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对葡萄酒的质量的作用。研究葡萄酒理化指标与葡萄酒质量的联系,需要运用变量间的相关性及 系数法分析葡萄酒的理化指标与葡萄酒质量评价指标的相关性,通过比较选出与葡萄酒评价的一级指标相关性程度大的葡萄酒成分,进行回归分析法,建立酿酒葡萄的理化指标与葡萄酒质量之间的拟合方程,结合各个质量一级指标的权重,从而完成了从葡萄酒成分对葡萄酒质量的客观评价。综合计算结果,与酿酒葡萄分级的结果吻合,所以分析结果较客观。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值