葡萄酒的评价模型

摘要

本文首先通过对葡萄酒的人为品尝评分结果的分析,利用相关系数和肯德尔和谐系数分析两组评酒员评分的差异,得出两组评酒员对红葡萄酒的评分结果较一致,对白葡萄酒的评分结果存在一定差异,再利用克隆巴赫(信度)系数评价两组评酒员分别对红葡萄酒和白葡萄酒各种酒样品评分的信度系数,去掉克隆巴赫(信度)系数不符合要求的酒样品的打分数据,在符合要求的酒样品中,把所有样品评分的克隆巴赫(信度)系数求平均值后得到每个组的最终克隆巴赫(信度)系数,利用该克隆巴赫(信度)系数取出两组评分数据中可信度较高的第一组。

然后,对葡萄的理化指标进行分析,开始是利用因子分析法中的主成分分析法提取出葡萄中理化指标的主成分,接下来利用提取出来的主成分数据,用K-means聚类分析法将红葡萄分成四类,白葡萄也分成四类,再结合可信度较高的第一组中每一类酒样品的打分数据,将每一类中每个酒样品分数的平均值加起来求平均值,得到每一类的一个分数,按照分数高低将这四类评为四个等级。

其次,找出酿酒葡萄和葡萄酒理化指标之间的联系,利用回归分析求出回归方程,利用最小二乘法求出多项式拟合方程,回归方程和多项式方程均能反映两者之间的联系。

接下来,用酿酒葡萄和葡萄酒理化指标来建立评价葡萄酒质量的方程,首先把酿酒葡萄和葡萄酒理化指标之间有联系的指标取出来,直接利用得到的多项式方程来反映两者的指标,没有联系的部分把葡萄中的主成分单独拿出来,再把葡萄酒中的成分单独拿出来,综合这些指标,结合专家评分结果,利用多元回归分析得到评价葡萄酒质量的回归方程,为粗略评价模型。

最后,利用附件三中的芳香物质代替评酒员为酒样品评分中的香气,结合葡萄酒和葡萄的主要理化指标来回归,最终得到一组反映外观、香气、口感、平衡/整体评价的几个回归方程,利用这些回归方程对应的参数数据代入回归方程得到葡萄酒每一项的评分,根据评分和相应的酒样品品尝的权系数值,利用模糊理论,对得到的结果进行评价就能确定葡萄酒的质量和等级。最终得出:结合芳香物质,可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

在模型改进中,利用BP神经网络对得到的回归方程进行训练,并用已有数据进行检验,测试模型的准确性,最终得到葡萄酒质量的综合评价模型。

整个求解过程中利用了SPSS软件和MATLAB软件辅助求解。

 

 

 

 

 

关键词:葡萄酒,主成分分析,相关性,聚类,回归分析,BP神经网络

 

 

 

一、        问题的提出

1.1 背景

 

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检