2012年数学建模A题论文

葡萄酒的评价
摘 要
本文针对葡萄酒的评价问题,建立了基于 KW 检验和信度分析的评价模型,
解决了对评价结果显著性差异的分析和可信度的计算问题;建立了基于聚类分析
的评价模型,解决了对酿酒葡萄进行分级的问题;建立了基于主成份分析法的评
价模型,解决了各类理化指标之间的联系问题;建立了基于多元回归分析的评价
模型,解决了各类理化指标与葡萄酒质量间的关系构建问题,并论证能否用各类
理化指标来评价葡萄酒的质量的问题。
针对问题一,建立了基于 KW 检验和信度分析的评价模型,解决了对评价结
果显著性差异的分析和可信度的计算问题。首先,计算各组样品的平均秩,初步
判断多个独立总体的分布有无显著性差异。其次,基于 KW 检验计算其显著性水
( 取平均值 ) ,所得结果如下: 0.4022 0.3415 0.2824 0.2263 ,有显著性差异。
再次,基于克伦巴赫系数对数据进行信度分析,所得信度平均值依次为: 0.8815
0.836 ,第一组更可信。接着,舍去部分数据进行灵敏度分析,所得系数平均值
最大变化量为 0.021 ,灵敏度较低。最后,采用双总体 T 检验进行检验,所得结
果如下: 0.3957 0.3326 0.2903 0.2132 ,与上述一致,证明了模型的合理性。
针对问题二,建立了基于 Q 型聚类分析的评价模型,解决了对酿酒葡萄进行
分级的问题。首先,将质量分为香气质量和口感质量,基于相关系数得出两者与
酿酒葡萄的理化性质指标之间的相关性,筛选出高相关性的指标。其次,根据信
度的权重采用熵权法引入打分制度,得出葡萄酒的综合评价得分。再次,基于高
相关性的指标和综合评价得分,采用聚类分析法对葡萄进行分类,所得结果如下
( 以红葡萄样品为例 ) 3 9 21 1 8 为一级, 2 14 23 19 5 13 6 24
4 22 10 16 11 为二级,其余为三级。接着,于原有的综合评价得分加一进
行灵敏度分析,所得结果变化如下: 2 5 变为三级, 7 变为二级,灵敏度较低。
最后,对照信度最高的评价得分,所得结果与之一致,证明了模型的合理性。
针对问题三,建立了基于主成份分析法的评价模型,解决了各类理化指标之
间的联系问题。首先,根据葡萄酒的理化指标的相关系数,选取单宁等相关性较
高的参量作为研究对象。其次,基于最小二乘法拟合出各类理化指标之间的函数
关系式。再次,选取主成份贡献率之和大于 80% 的主要因素进行灵敏度分析,所
得函数关系式参数变化最大为 0.13 ,灵敏度较高。最后,采用任意两点插值进行
检验,得到相应的函数关系式,与上述一致,证明了模型的合理性。
针对问题四,建立了基于多元回归分析的评价模型,解决了各类理化指标与
葡萄酒质量关系的构建问题,并论证能否用各类理化指标来评价葡萄酒的质量。
首先,基于主成份分析法对酿酒葡萄的理化指标进行降维,并与葡萄酒的主成份
合并,将所得主成份与所评结果进行多元回归分析,得到关于 11 个变量的函数
表达式。其次,基于聚类分析法将各类芳香物质分为 3 类,以其中心点作为各类
物质的代表,将所得代表与第一组评酒员评价结果进行多元回归分析,得到相应
的函数关系式。再次,以两次多元回归分析的残差作为评价葡萄酒质量的标准,
所得结果为: 0.770 0.643 ,残差相近,不能完全用各类理化指标评价葡萄酒的
质量。接着,于变量上增加一进行灵敏度分析,表达式系数改变量最大为 0.23
灵敏度较低。最后,基于最小二乘法与评价结果进行拟合,表达式系数改变量最
大为 0.31 ,证明了模型的合理性。
关键词 KW 检验、克伦巴赫系数、熵权法、 Q 型聚类分析、主成份分析
1 一、问题重述
1.1 问题背景
随着全球经济的快速增长和人们收入水平的提高,消费者对高品质葡萄酒的
需求不断增加。葡萄酒市场竞争也异常激烈和无序,但由于相应规范的制定工作
的限制,我国关于葡萄酒质量等级分划的标准还未完善,国家迫切需要制定统一
的质量等级制度。故而葡萄酒的评价显得尤为重要,品评中的每一个字眼都会对
一款葡萄酒的名气产生至关重要的意义,因此,酒评无论褒贬,都需要清晰有据,
正确的评价才会找到葡萄酒真正的价值。
1.2 问题重述
问题 1 :分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果
更可信?
问题 2 :根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
问题 3 :分析酿酒葡萄与葡萄酒的理化指标之间的联系。
问题 4 :分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能
否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、问题分析
葡萄酒的评价共包含四个问题,其中问题一可细分为两小问,即分析评酒员
的评价结果有无显著性差异和结果可信度的问题。问题二是根据酿酒葡萄的理化
指标和葡萄酒的质量这两个因素对这些酿酒葡萄进行分级。问题三是分析酿酒葡
萄与葡萄酒的理化指标之间的联系。问题四可细分为两小问,即分析酿酒葡萄和
葡萄酒的理化指标对葡萄酒质量的影响,并讨论能否用葡萄和葡萄酒的理化指标
来评价葡萄酒的质量。问题整体思路较为清晰,层层递进。问题一是针对评酒员
评价结果的显著性分析和可信度计算的问题。问题二建立在问题一的可信度计算
结果的基础上,得出葡萄酒的综合评价得分,系统规定葡萄酒的质量得分参数,
规范葡萄酒质量的评价指标。是基于葡萄酒的综合评价得分和理化指标的分级问
题。问题三是对酿酒葡萄和葡萄酒的理化指标之间的函数构建问题,是对一、二
两问的延伸。问题四则是建立在前三问的基础上,分析酿酒葡萄和葡萄酒的理化
指标对葡萄酒质量的影响,同时基于酿酒葡萄和葡萄酒的理化指标讨论是否可以
忽略葡萄和葡萄酒的芳香物质这一指标。
2.1 问题一的分析
问题一是基于附件 1 中两组评酒员的评价结果,分析是否有显著性差异并确
定结果可信度,因此该问题属于评价类建模问题。故针对问题一,建立了基于 KW
检验和信度分析的评价模型,解决了评价结果显著性差异的分析和可信度的计算
问题。首先,计算各组样品的平均秩 [1] ,初步判断多个独立总体的分布有无显著
性差异。如果各组样本的平均秩大致相等,则可以认为多个独立总体的分布没有
显著差异。如果各样本的平均秩相差很大,不能认为多个独立总体的分布无显著
差异。其次,常见的显著性检验的方法包括 KW 检验 [2] T 检验和 F 检验,其中
KW 检验基于对样本排序并计算秩次,然后比较两组样本的秩和,从而得出结论,
适用于两组独立样本且样本数量足够大的情况下使用。故该题基于 KW 秩和比检
验计算其显著性水平。再次,常见的信度分析包括折半信度法、库得 - 理查森信
2 3
度分析和克伦巴赫信度系数法,其中克伦巴赫信度系数法 [3] 可以快速、简便地评
估量表或问卷的内部一致性,同时具有较高的可靠性和有效性。故基于克伦巴赫
系数对数据进行信度分析。接着,舍去部分数据进行灵敏度分析,检验灵敏度的
大小。最后,采用双总体 T 检验 [4] 进行模型检验,证明模型的合理性。
2.2 问题二的分析
问题二是基于附件 2 酿酒葡萄的理化指标和评价结果,分析酿酒葡萄的理化
指标和葡萄酒的质量对这些酿酒葡萄的影响,并对酿酒葡萄进行分级,因此该问
题属于评价类建模问题。故针对问题二,建立了基于 Q 型聚类分析的评价模型,
解决了对酿酒葡萄进行分级的问题。首先,将质量分类为香气质量和口感质量,
基于皮尔森相关系数 [5] 得出两者与酿酒葡萄的理化性质指标之间的相关性,筛选
出高相关性的指标。其次,基于问题一的信度分析,可依据其权重进行综合评价
打分,常见的权重分析包括环比权重法,熵权法等。其中环比权重法适用于具有
周期性变化的问题,但需要注意的是,环比权重法的结果容易受到数据波动和异
常值的影响,熵权法更适用于多指标决策问题,尤其适用于具有不确定性和模糊
性的系统,故该题采用熵权法进行计算。根据信度的权重采用熵权法 [6] 引入打分
制度,得出葡萄酒的综合评价得分。再次,基于高相关性的指标和综合评价得分,
采用聚类分析法 [7] 对葡萄酒进行分类,同时经过权重计算将 55 分以上的葡萄分
为一级,
3
5-55 分的分为二级 35 分以下的分为三级,由此得出葡萄酒的具体分类。
接着,于原有的综合评价得分加一进行灵敏度分析,检验其灵敏度大小。最后,
对照信度最高的第一组评价得分,证明模型的合理性。
2.3 问题三的分析
问题三是基于附件 2 酿酒葡萄与葡萄酒的理化指标,分析酿酒葡萄与葡萄酒
的理化指标之间的联系,因此该问题属于评价类建模问题。故针对问题三,建立
了基于主成份分析法的评价模型,解决了酿酒葡萄与葡萄酒的理化指标之间的联
系问题。首先,对每个变量进行标准化变换,根据葡萄酒的理化指标的相关系数,
选取单宁、葡萄总黄酮、总酚、氨基酸总量和黄酮醇这五个相关性最高的参量作
为研究对象。其次,对以上五个类型进行主成份分析 [8] 并计算贡献率,每个综合
指标所反映各个样本的信息量等于对应特征向量 ( 综合指标的系数 ) 的特征值,选
取使主成份贡献率之和大于 85% 的主要因素进行降维。再次,基于最小二乘法拟
合出酿酒葡萄与葡萄酒的理化指标之间的函数关系式,最小二乘法是在知道一组
不准确实验数据中寻找自变量 x 和因变量 y 之间的函数关系 y F ( x ) ,用拟合曲
线 S ( x ) 去逼近实验数据,来描述自变量 x 和因变量 y 之间的函数关系,适用于该
题关系式的确定。接着,选取使主成份贡献率之和大于 80% 的主要因素进行灵敏
度分析,比较所得函数关系式参数变化量,检验灵敏度大小。最后,采用插值法
[10] 进行检验,证明模型的合理性。
2.4 问题四的分析
问题四是基于附件 2 酿酒葡萄与葡萄酒的理化指标和附件 3 葡萄和葡萄酒的
芳香物质,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否
用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。故针对问题四,建立了基于多
元回归分析 [11] 的评价模型,解决了各类理化指标与葡萄酒质量关系的构建问题,
并论证能否用各类理化指标来评价葡萄酒的质量。首先,基于主成份分析法对酿
酒葡萄的理化指标进行降维,得到酿酒葡萄的主体成份。将酿酒葡萄和葡萄酒的 4
主成份合并,多元回归分析可以解释多个变量之间的复杂关系,通过使用多个自
变量,可以控制其他因素的影响,从而更准确地预测因变量的值,故将所得主成
份与第一组评酒员评出的结果进行多元回归分析,由此得到酿酒葡萄和葡萄酒的
理化指标与葡萄酒质量的函数关系式。其次,基于聚类分析法将各类芳香物质分
3 类,以其中心点作为各类物质的代表,将所得代表与第一组评酒员评价结果
进行多元回归分析,进一步得到葡萄和葡萄酒的芳香物质与葡萄酒质量的函数关
系式。再次,以两次多元回归分析的残差 [12] 作为评价葡萄酒的质量的标准。接着,
于变量上增加一进行灵敏度分析,检验灵敏度大小。最后,基于最小二乘法 [13]
与第一组评酒员评价结果进行拟合,证明模型的合理性。
三、基本假设
(1) 题目附件中所提供的各项理化指标数据均真实可靠;
(2) 酿酒葡萄和葡萄酒的理化指标和芳香物质在一定时间内不发生改变;
(3) 酿酒工艺和贮存条件等对葡萄酒质量及理化指标无影响;
(4) 测量数据大致呈正态分布。
四、符号说明
R i
i 组秩和
C
校正系数
n i
i 组样本个数
a
克伦巴赫信度系数
期望值
S d
标准偏差
Z
判断矩阵
z j
j 组的主成份向量
五、模型建立与求解
5.1 问题一的模型建立与求解
针对问题一,建立了基于 KW 检验和信度分析的评价模型,解决了评价结果
是否具有显著性差异和可信度的问题。首先,计算各组样品的平均秩,初步判断
多个独立总体的分布有无显著性差异。其次,基于 KW 检验计算其显著性水平 (
均值 ) ,所得结果如下: 0.4022 0.3415 0.2824 0.2263 ,有显著性差异。再次,
基于克伦巴赫系数对数据进行信度分析,所得信度平均值依次为: 0.8815 0.836
第一组更可信。接着,舍去部分数据进行灵敏度分析,所得系数平均值依次为:
0.8721 0.8203 ,灵敏度较低。最后,采用双总体 T 检验进行模型检验,所得结 5
果如下: 0.3957 0.3326 0.2903 0.2132 ,证明了模型的合理性。
5.1.1 模型建立
首先,计算各组样品的平均秩,初步判断多个独立总体的分布有无显著性差
异。如果各组样本的平均秩大致相等,则可以认为多个独立总体的分布没有显著
差异。其次,基于 KW 检验计算其显著性水平 ( 取平均值 ) ,其理论基础如下:
KW 检验是一种秩和检验,根据所有数据从小到大排序,算出每个数据的秩。
其中 R i 为每组的秩和, n i 为每组的样本个数。当每组样本中的观察数目有 5 个或
5 个以上,则样本统计量 KW c 的分布与自由度为 k 1 的卡方分布非常接近。因此,
KW 统计量可利用卡方分布进行检验。
 
k
i i
i
i
i
k
i
i
n
n
R
n n
n
n
R
n n
KW
n
1
2
2
1
3( 1).
( 1)
12
)
2
1
(
( 1)
12
全体样本的秩方差
组间平方和
如果样本中存在结值 ( 数据相同秩值的个数 ) ,则校正系数 C 为:
n n
C
n
i
i i
 
3
1
( 3 )
1
 
其中 i 为第 i 个结值的个数。调整后的 KW c 统计量如下:
KW C K C W
再次,基于克伦巴赫系数对数据进行信度分析,其理论基础如下:
克伦巴赫信度系数是一套测验可靠性的方法,依一定公式估量测验的内部一
致性作为信度的指标。它克服部分折半法的缺点,是社会研究最常使用的信度指
标,它是测量一组同义或平行测“总和”的信度及其公式如下:
)
( 1)(
)]
[1 (
2
2
x
i
a K K   S S
其中, K 为量表中题项的总数, S 2 i 为第 i 得分的方差, S 2 i 为全部题项总得分的
方差。从公式中可以看出, a 系数评价的是各题项得分间的一致性。
统计上用克伦巴赫信度系数指标来检验同一向度的一组题目是否测量同一
特质,取值范围在 0-1 之间。 a 值介于 0-1 1 表示这组题目完全符合“尺”的特
质,而 0 表示完全不符合。
接着,舍去部分数据进行灵敏度分析,检验模型灵敏度大小。最后,采用双
总体 T 检验进行模型检验,证明模型的合理性。
5.1.2 模型求解
计算各组样品的平均秩,初步判断多个独立总体的分布有无显著性差异。基
KW 检验计算其显著性水平 ( 平均值 ) ,所得结果如下表所示:
1 显著性水平结果表
白葡萄酒的 KW 显著性
红葡萄酒的 KW 显著性
第一组为标度 第二组为标度 第一组为标度 第二组为标度 6
澄清度
0.316
0.304
0.454
0.363
色调
0.22
0.338
0.242
0.199
纯正度
0.56
0.467
0.173
0.123
浓度
0.617
0.36
0.287
0.492
质量
0.228
0.179
0.156
0.086
纯正度
0.075
0.058
0.035
0.114
浓度
0.265
0.421
0.61
0.225
持久性
0.932
0.795
0.424
0.198
质量
0.109
0.136
0.285
0.292
评价
0.7
0.357
0.158
0.171
平均值
0.4022
0.3415
0.2824
0.2263
通过 KW 检验,其显著性水平 ( 平均值 ) 所得结果如下: 0.4022
0
.3415
0
.2824
0.2263 ,同时显著性水平的平均值皆大于 0.05 ,有显著性差异。
基于克伦巴赫系数对数据进行信度分析,所得结果如下:
2 信度分析结果
第一组白葡萄
第一组红葡
萄酒
第二组白葡萄
第二组红葡
萄酒
可信度分析
0.843
0.92
0.852
0.82
可信度平均值
0.8815
0.836
通过计算可知,所得信度平均值依次为: 0.8815 0.836 ,第一组的可信度比
较高。接着,舍去部分数据进行灵敏度分析,所得系数平均值依次为: 0.8721
0.8203 ,灵敏度较低。
5.1.3 问题结论
通过计算各组样品的平均秩,初步判断多个独立总体的分布有无显著性差异。
其次,基于 KW 检验计算其显著性水平 ( 平均值 ) ,所得结果如下: 0.4022 0.3415
0.2824 0.2263 ,有显著性差异。再次,基于克伦巴赫系数对数据进行信度分析,
所得信度平均值依次为: 0.8815 0.836 ,第一组更可信。最后,舍去部分数据进
行灵敏度分析,所得系数平均值依次为: 0.8721 0.8203 ,灵敏度较低。
5.1.4 检验分析
采用双总体 T 检验进行模型检验,其理论基础如下:
双总体 T 检验是检验两个样本平均数与其各自所代表的总体的差异是否显
著。双总体 T 检验又分为两种情况,一是独立样本 T 检验 ( 各实验处理组之间毫
无相关存在,即为独立样本 ) ,该检验用于检验两组非相关样本被试所获得的数
据的差异性;一是配对样本 T 检验,用于检验匹配而成的两组被试获得的数据
或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相
关样本。
(1) 独立样本 T 检验统计量为 :
)
1
( 1
2
( 1) ( 1)
2
1
1 2
1 1 2 2 2 2
1 2
n
n
n n
n S n S
X X
T
 
  
S 1 2 S 2 2 为两样本方差; n 1 n 2 为两样本容量。
(2) 配对样本检验 7
配对样本 T 检验可视为单样本 T 检验的扩展,不过检验的对象由一群来自常
态分配独立样本更改为二群配对样本之观测值之差。若二配对样本 x 1 i x 2 i 之差
d i x 1 i x 2 i 独立,且来自常态分配,则 d i 之母体期望值 是否为 0 可利用以
下统计量:
S n
T d
d
  0
其中
n
d
d
n
i
i
1
为配对样本差值的平均数,
1
( )
1
2
n
d d
s
n
i
i
d
为配对样本差值之标
准偏差, n 为配对样本数。该统计量 T 在零假说: 0 为真的条件下服从自由
度为 n 1 T 分布。
所得结果如下: 0.3957 0.3326 0.2903 0.2132 ,与上述算法所得答案一致,
证明了模型的合理性。
5.1.5 小结
针对问题一,建立了基于 KW 检验和信度分析的评价模型,解决了评价结果
是否具有显著性差异和可信度的问题。首先,计算各组样品的平均秩,初步判断
多个独立总体的分布有无显著性差异。其次,基于 KW 检验计算其显著性水平 (
均值 ) ,所得结果如下: 0.4022 0.3415 0.2824 0.2263 ,有显著性差异。再次,
基于克伦巴赫系数对数据进行信度分析,所得信度平均值依次为: 0.8815 0.836
第一组更可信。接着,舍去部分数据进行灵敏度分析,所得系数平均值依次为:
0.8721 0.8203 ,灵敏度较低。最后,采用双总体 T 检验进行模型检验,所得结
果如下: 0.3957 0.3326 0.2903 0.2132 ,证明了模型的合理性。
5.2 问题二的模型建立与求解
针对问题二,建立了基于 Q 型聚类分析的评价模型,解决了对酿酒葡萄进行
分级的问题。首先,将质量分类为香气质量和口感质量,基于皮尔森相关系数得
出两者与酿酒葡萄的理化性质指标之间的相关性,筛选出高相关性的指标。其次,
基于问题一的信度分析,根据信度的权重采用熵权法引入打分制度,得出葡萄酒
的综合评价得分。再次,基于高相关性的指标和综合评价得分,采用聚类分析法
对葡萄酒进行分类,所得结果如下 ( 以红葡萄样品为例 ) 3 9 21 1 8 为一级,
2 14 23 19 5 13 6 24 4 22 10 16 11 为二级, 17 15 20 25
26 7 18 12 27 为三级。接着,于原有的综合评价得分加一进行灵敏度分析,
所得结果变化如下: 2 5 变为三级, 7 变为二级,灵敏度较低。最后,对照信度
最高的评价得分,所得结果与之一致,证明了模型的合理性。
5.2.1 模型建立
首先,将质量分类为香气质量和口感质量,基于皮尔森相关系数得出两者与
酿酒葡萄的理化性质指标之间的相关性,筛选出高相关性的指标,皮尔森相关系
数的理论基础如下:
两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的
商: 8
Y
X
Y
X
Y
X
X Y
Y
Y E X
X
 
) )]
(
) [(
,
, cov(
 
上式定义了总体相关系数,常用希腊小写字母 作为代表符号。估算样本的
协方差和标准差,可得到皮尔逊相关系数,常用英文小写字母 r 代表 :
 
n
i
i
n
i
i
n
i
i i
Y Y
X X
X X Y Y
r
1
2
1
2
1
( )
( )
( )( )
其次,基于问题一的信度分析,根据信度的权重采用熵权法引入打分制度,
得出葡萄酒的综合评价得分,其理论基础如下:
(1) 对数据进行预处理
假设有 n 个要评价的对象, m 个评价指标 ( 已经正向化 ) 构成的正向化矩阵如
下:
n n nm
m
m
x x x
x x x
x x x
 
1 2
21 22 2
11 12 1
对数据进行标准化,标准化后的矩阵记为 Z Z 中的每一个元素:
n
i
i
j
ij
ij
x
x
Z
1
2
判断 Z 矩阵中是否存在负数,如果存在的话,需要对 X 使用另外一种标准
化方法。
对矩阵 X 进行一次标准化,标准化公式如
j j nj
nj
j
j
nj
j
j
i
j
x x x
x
x x
x
x
x
Z x
min , , ,
, ,
max ,
,
, ,
m
in
1 2
2
1
2
1
(2) 计算第 j 项指标下第 i 个样本所占的比重,并将其看作相对熵计算中用到
的概率。
在上一步的基础上计算概率矩阵 P P 中的每一个元素如下:
n
i
ij
ij
i
j
Z
Z
P
1
(3) 计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的
熵权。
对第 j 个指标而言,其信息熵的计算公式为:
  
n
i
ij
i
e j n P j p j m
1
ln 1 ln( ) ( 1,2, , )
e j 越大,则第 j 个指标的信息熵越大,其对应的信息量越小。
定义信息效用值 d j ,公式如下:
d j 1 e j
将信息效用值归一化,得到每个指标的熵权: 9
m
j
j
j
j
d
d
W
1
再次,基于高相关性的指标和综合评价得分,采用聚类分析法对葡萄酒进行
分类,同时将 55 分以上的葡萄分为一级, 35-55 分的分为二级 35 分以下的分为
三级,由此得出葡萄酒的具体分类。接着,于原有的综合评价得分加一进行灵敏
度分析,检验其灵敏度大小。
5.2.2 模型求解
将质量分类为香气质量和口感质量,基于皮尔森相关系数得出两者与酿酒葡
萄的理化性质指标之间的相关性,筛选出高相关性的指标 ( 以红葡萄酒为例计算 )
3 香气质量和口感质量与酿酒葡萄的理化指标之间的相关性
红葡萄酒
香气质量
口感质量
蛋白质
0.523
氨基酸总量
0.238
花色苷
0.356
蛋白质
0.402
DPPH 自由基 1/IC50
0.689
酒石酸
0.364
总酚
0.51
苹果酸
-0.438
单宁
0.29
柠檬酸
-0.216
葡萄总黄酮
0.619
多酚氧化酶活力
-0.226
白藜芦醇
0.305
DPPH 自由基 1/IC50
0.45
黄酮醇
0.302
总酚
0.417
还原糖
-0.281
单宁
0.203
可溶性固形物
-0.211
葡萄总黄酮
0.544
PH
0.416
黄酮醇
0.326
可滴定酸
-0.498
PH
0.463
固酸比
0.379
可滴定酸
-0.255
干物质含量
-0.219
果梗比
0.232
果梗比
0.456
出汁率
0.294
出汁率
0.295
果皮颜色
-0.225
-0.343
其次,基于问题一的信度分析,根据信度的权重采用熵权法引入打分制度,
得出葡萄酒的综合评价得分,所得结果如下表所示 ( 香气质量为例,截取部分结
果,详见附录 )
4 红葡萄酒权重
红葡萄酒权重
是否为负
蛋白质
0.055924707
花色苷
0.087423469
DPPH 自由基 1/IC50
0.055394382
固酸比
0.054002601
干物质含量
0.027539058
果梗比
0.065064381
10
出汁率
0.037229084
再次,基于高相关性的指标和综合评价得分,所得结果如下表所示 ( 截取部
分结果,详见附录 )
5 高相关性的指标和综合评价得分
香气评分
口感评分
平均值
葡萄样品 3
90.81133893
100
95.40566946
葡萄样品 9
100
31.70550658
65.85275329
葡萄样品 21
55.38212326
75.14032673
65.261225
葡萄样品 18
30.55955197
30.25760291
30.40857744
葡萄样品 12
25.61546411
31.89788265
28.75667338
葡萄样品 27
38.13033645
16.53843723
27.33438684
采用聚类分析法对葡萄酒进行分类,所得结果如下 ( 以红葡萄样品为例 ) 3
9 21 1 8 为一级, 2 14 23 19 5 13 6 24 4 22 10 16 11 为二
级, 17 15 20 25 26 7 18 12 27 为三级。同理可以得出白葡萄样品 28
22 26 3 5 10 24 为一级,白葡萄样品葡萄样品 4 15 1 25 2 9 20
21 27 为二级,白葡萄样品 14 17 6 12 7 23 11 8 18 16 19 13
为三级。接着,于原有的综合评价得分加一进行灵敏度分析,所得结果变化如下
( 以红葡萄样品为例 ) 2 5 变为三级, 7 变为二级,灵敏度较低。
5.2.3 问题结论
首先,将质量分类为香气质量和口感质量,基于皮尔森相关系数得出两者与
酿酒葡萄的理化性质指标之间的相关性,筛选出高相关性的指标。其次,基于问
题一的信度分析,根据信度的权重采用熵权法引入打分制度,得出葡萄酒的综合
评价得分。再次,基于高相关性的指标和综合评价得分,采用聚类分析法对葡萄
酒进行分类,所得结果如下 ( 以红葡萄样品为例 ) 3 9 21 1 8 为一级, 2
14 23 19 5 13 6 24 4 22 10 16 11 为二级, 17 15 20 25 26
7 18 12 27 为三级。接着,于原有的综合评价得分加一进行灵敏度分析,所
得结果变化如下: 2 5 变为三级, 7 变为二级,灵敏度较低。
5.2.4 检验分析
选取第一组葡萄酒品尝平均评分与所分葡萄等级进行比对,所得结果如下表
所示 ( 以红葡萄样品为例,截取部分结果,详见附录 )
6 葡萄酒品尝平均评分与所分葡萄等级对比
样品编号
品尝平均评分
划分等级
1
7.7
一级
2
9.6
二级
3
9.4
一级
25
8.3
三级
26
8.9
三级
27
9.0
三级
所得结果与葡萄等级区分一致,证明了模型的合理性。 11
5.2.5 小结
基于高相关性的指标和综合评价得分,采用聚类分析法对葡萄酒进行分类,
所得结果如下 ( 以红葡萄样品为例 ) 3 9 21 1 8 为一级, 2 14 23 19 5
13 6 24 4 22 10 16 11 为二级, 17 15 20 25 26 7 18 12 27
为三级。接着,于原有的综合评价得分加一进行灵敏度分析,所得结果变化如下:
2 5 变为三级, 7 变为二级,灵敏度较低。最后,对照信度最高的评价得分,所
得结果与之一致,证明了模型的合理性。
5.3 问题三的模型建立与求解
针对问题三,建立了基于主成份分析法的评价模型,解决了酿酒葡萄与葡萄
酒的理化指标之间的联系问题。首先,对每个变量进行标准化变换,根据葡萄酒
的理化指标的相关系数,选取单宁、葡萄总黄酮、总酚、氨基酸总量和黄酮醇这
五个相关性最高的参量作为研究对象。其次,对以上五个类型进行主成分分析并
计算贡献率,每个综合指标所反映各个样本的信息量等于对应特征向量 ( 综合指
标的系数 ) 的特征值,选取使主成份贡献率之和大于 85% 的主要因素进行降维。
再次,基于最小二乘法拟合出酿酒葡萄与葡萄酒的理化指标之间的函数关系式
( 以白葡萄酒的单宁为例 ) y 0.56 y 1 0.2 y 2 0.14 y 3 。接着,选取使主成份贡献
率之和大于 80% 的主要因素进行灵敏度分析,所得函数关系式参数变化最大为
0.13 , 灵 敏 度 较 高 。 最 后 , 采 用 插 值 法 进 行 检 验 , 所 得 函 数 关 系 式 :
y 0.52 y 1 0.17 y 2 0.15 y 3 ,与上述一致,证明了模型的合理性。
5.3.1 模型建立
首先,由于酿酒葡萄各参数的单位不统一,对每个变量进行标准化变换,其
理论基础如下:
将原始变量 x k 标准化为 x k * ,即
k m
s
x
x x
k
k
k k
, 1,2,3, ,
*
 
其中, x k * 的平均数为 0 ,标准差为 1
总体 x * 的协方差矩阵即为总体 x 的相关系数矩阵。根据各样本原指标的观测
x ik 或标准化变化后的观测值 x i * k 求出系数 b kj ,建立用标准化变换后的指标 x k *
示综合指标 z j 的方程
k
z j b kj x k * ,也可以建立用指标 x k 表示出如下的综合指标
z j 的方程:
* j .
k
z j b kj x k a
根据葡萄酒的理化指标的相关系数,其次,对以上五个类型进行主成分分析
并计算贡献率,每个综合指标所反映各个样本的信息量等于对应特征向量 ( 综合
指标的系数 ) 的特征值,选取使主成份贡献率之和大于 85% 的主要因素进行降维,
其理论基础如下:
1 、将观测数据标准化,并计算 x k s k ( k , j 1,2, , m )
2 、由相关系数矩阵 R 得到特征值 j ( j 1,2, , m ) 及各个主成分的方差贡献
率、贡献率和累计贡献率,并根据累计贡献率确定主成分保留的个数 p
写出 m 个基本方程组: 12
   

   
   
)
(
)
(
)
(
) 2 2
(
1 1
)
(
) 2
(
) 2
(
) 22 2
(
21 1
)
(
) 1
(
) 1
(
) 12 2
(
11 1
m j m j mm m j j m j
j j m m j j j
j j m m j j j
r x r x r x x
r x r x r x x
r x r x r x x
其中, j 1,2, , m
利 用 施 密 特 正 交 方 法 , 对 每 一 个 j 求 它 的 对 应 基 本 方 程 组 的 解
, , , ) ( 1,2, , )
(
)
(
) 2
(
x 1 j x j x m j j m ,然后令
k
j
k
j
k
kj
x
x
b
) 2
(
)
(
)
(
,从而得到用
*
*
x 1 * , x 2 , , x m
表示的主成份向量
k
x
z j b kj x * ,或将
k
k
k k
s
x
x x
*
代入后得到用 x 1 , x 2 , , x m 所表
示的主成份向量 j
k
z j b kj x k * a
x 1 , x 2 , , x m 的观测值代入主成分向量的表达式中计算各个主成分向量。
计算原指标与主成分的相关系数即因子载荷,解释主成分的意义。
再次,基于最小二乘法拟合出酿酒葡萄与葡萄酒的理化指标之间的函数关系
式,其理论基础如下:
定义 y bx a 为关于 x 的经验回归方程,其中
a y bx
x nx
x y nx y
x x
x x y y
b
n
i
i
n
i
i i
n
i
i
n
i
i i
 
 
,
( )
( )( )
1
2 2
1
1
2
1
也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归
方程的方法叫最小二乘法。
接着,选取使主成份贡献率之和大于 80% 的主要因素进行灵敏度分析,比较
所得函数关系式参数变化量,检验灵敏度大小。
5.3.2 模型求解
根据葡萄酒的理化指标计算皮尔森相关系数,所得结果如下表所示 ( 截取部
分结果,详见附录 )
7 关于葡萄酒理化指标的皮尔森相关系数
单宁
出汁率
-0.294445658
果穗质量
0.071005835
百粒质量
0.040863275
总糖
0.355296547
可溶性固形物
0.348545016
干物质含量
0.228986514
选取单宁、葡萄总黄酮、总酚、氨基酸总量和黄酮醇这五个相关性最高的参
量作为研究对象,如下表所示: 13
8 相关性最高的参量
单宁
单宁
0.573832337
葡萄总黄酮 0.495083649
总酚
0.428391212
氨基酸总量 0.427816661
黄酮醇
0.410693429
对以上五个类型进行主成分分析并计算贡献率,其结果如下表所示:
9 五个类型相应的贡献率
贡献率
累积贡献率
单宁
56.34412961 56.34412961
葡萄总黄酮
20.2439001
76.58802971
总酚
13.72429688 90.31232659
氨基酸总量 8.748332662 99.060659252
黄酮醇
0.939340751
100
选取累计贡献率达到 85% 以上时候的成分进行最小二乘法的拟合,其结果如
下所示:
1 、白葡萄酿酒葡萄单宁 - 白葡萄酒单宁
y 1   0.007 x 1 4 0.1766 x 1 3 1.4395 x 1 2 4.6724 x 1 3.4362.
2 、白葡萄酿酒葡萄总黄酮 - 白葡萄酒单宁
y 2   0.0037 x 2 4 0.0866 x 2 3 0.6417 x 2 2 1.8227 x 2 0.0317.
3 、白葡萄酿酒葡萄总酚 - 白葡萄酒单宁
y 3 0.0016 x 3 4 0.062 x 3 3 0.8129 x 3 2 4.2972 x 3 9.4659.
利用主成分的比例计算得出最终表达式:
y 0.56 y 1 0.2 y 2 0.14 y 3
式中: x 1 表示白葡萄酿酒葡萄单宁, x 2 表示白葡萄酿酒葡萄总黄酮, x 3
示白葡萄酿酒葡萄总酚。
5.3.3 问题结论
针对问题三,建立了基于主成份分析法的评价模型,解决了酿酒葡萄与葡萄
酒的理化指标之间的联系问题。首先,根据葡萄酒的理化指标的相关系数,选取
单宁等相关性较高的参量作为研究对象。其次,选取使主成份贡献率之和大于
85% 的主要因素进行降维。再次,基于最小二乘法拟合出酿酒葡萄与葡萄酒的理
化指标之间的函数关系式 ( 以白葡萄酒的单宁为例 ) y 0.56 y 1 0.2 y 2 0.14 y 3
式中: x 1 表示白葡萄酿酒葡萄单宁, x 2 表示白葡萄酿酒葡萄总黄酮, x 3 表示白
葡萄酿酒葡萄总酚。接着,选取使主成份贡献率之和大于 80% 的主要因素进行灵
敏度分析,所得函数关系式参数变化最大为 0.13 ,灵敏度较高。
5.3.4 检验分析
采用任意两点插值进行检验,其理论基础如下:
插值法的计算方法是,假设我们需要在一个区间内插值,这个区间包含了 n
个数据点。可以通过选取一个插值函数 f ( x ) ,使得这个函数在这 n 个点上的值等
于已知的数据点的值。然后 , 我们可以使用这个插值函数来计算这个区间内的其 14
他点的值。
其函数表达式为:
1
2
1
1 2 1
) )
(
(
x
x
x
x
y y y y
  
,该公式是利用直线内插法,根据
已知的两个点 ( x 1 , y 1 ) x 2 , y 2 求出在它们之间的某一点 ( x , y ) 的纵坐标 y 的值。
其中, x 为待求点的横坐标, y 为待求点的纵坐标, x 1 , x 2 , y 1 , y 2 分别为已知点的
横纵坐标。
所得函数关系式如下所示:
y 0.52 y 1 0.17 y 2 0.15 y 3 .
与上述一致,证明了模型的合理性。
5.3.5 小结
针对问题三,建立了基于主成份分析法的评价模型,解决了酿酒葡萄与葡萄
酒的理化指标之间的联系问题。首先,对每个变量进行标准化变换,根据葡萄酒
的理化指标的相关系数,选取单宁、葡萄总黄酮、总酚、氨基酸总量和黄酮醇这
五个相关性最高的参量作为研究对象。其次,对以上五个类型进行主成分分析并
计算贡献率,每个综合指标所反映各个样本的信息量等于对应特征向量 ( 综合指
标的系数 ) 的特征值,选取使主成份贡献率之和大于 85% 的主要因素进行降维。
再次,基于最小二乘法拟合出酿酒葡萄与葡萄酒的理化指标之间的函数关系式如
下所示 ( 以白葡萄酒的单宁为例 )
y 0.56 y 1 0.2 y 2 0.14 y 3 .
接着,选取使主成份贡献率之和大于 80% 的主要因素进行灵敏度分析,所得
函数关系式参数变化最大为 0.13 ,灵敏度较高。最后,采用插值法进行检验,所
得函数关系式如下所示:
y 0.52 y 1 0.17 y 2 0.15 y 3
与上述一致,证明了模型的合理性。
5.4 问题四的模型建立与求解
针对问题四,建立了基于多元回归分析的评价模型,解决了各类理化指标与
葡萄酒质量关系的构建问题,并论证能否用各类理化指标来评价葡萄酒的质量。
首先,基于主成份分析法对酿酒葡萄的理化指标进行降维,将酿酒葡萄和葡萄酒
的主成份合并,将所得主成份与第一组评酒员所评结果进行多元回归分析,得到
如下表达式:
0.355 0.034 0.213 0.091 0.039 .
0.3 1.3561 0.2942 0.066 0.019 0.201
7 8 9 10 11
1 2 3 4 5 6
x x x x x
y x x x x x x
    
     
其次,基于聚类分析法将各类芳香物质分为 3 类,以其中心点作为各类物质
的代表,将所得代表与第一组评酒员评价结果进行多元回归分析,所得结果如下:
y 0.462 x 1 0.409 x 2 0.352 x 3 .
再次,以两次多元回归分析的残差作为评价葡萄酒的质量的标准,所得结果
为: 0.765 0.632 ,残差相近,不能完全来评价葡萄酒的质量。接着,于变量上
增加一进行灵敏度分析,表达式系数改变量最大为 0.23 ,灵敏度较低。最后,基
于最小二乘法与评出的结果进行拟合,表达式系数改变量最大为 0.31 ,证明了模
型的合理性。
5.4.1 模型建立 15
首先,基于主成份分析法对酿酒葡萄的理化指标进行降维,将酿酒葡萄和葡
萄酒的主成份合并,将所得主成份与第一组评酒员评出的结果进行多元回归分析,
其理论基础如下:
多元回归分析是研究多个变量之间的关系的回归分析方法,是反映一种现象
或事物的数量依多种现象或事物的数量的变动而相应地变动的规律。建立多个变
量之间线性或非线性数学模型数量关系式的统计方法。一般有以下几个方面的应
用:
(1) 确定几个特定的变量之间是否存在相关关系 , 如果存在的话 , 找出它们
之间合适的数学表达式;
(2) 根据一个或几个变量的值 , 预测或控制另一个变量的取值 , 并且可以知
道这种预测或控制能达到什么样的精确度;
(3) 进行因素分析。例如在对于共同影响一个变量的许多变量 ( 因素 ) 之间 ,
出哪些是重要因素 , 哪些是次要因素 , 这些因素之间又有什么关系等等。
设自变量 x 1 ,x 2 , ,x p 的观测值 x i 1 ,x i 2 , ,x ip 及因变量 y 对应的观测值 y i 满足
关系式:
y x i , i , , ,n ; j , , , p
j
i 0 j ij 1 2   1 2
 
 
i , ,n
N ,
Y X
) , 1
~ (0
2
 
 
其中 i 是互相独立且都服从正态分布 N (0 2 ) 的随机变量。若
   
 
p
1
0
p
1
0
n1 n 2 n
2
21 31
11 12 1
2
1
1
1
1
Y X
, e
x x x
x x x
x x x
y
y
y
p
p
p
n
由最小二乘估计得到参数估计公式
( X T X) -1 ( X T Y)
ˆ
其次,基于聚类分析法将各类芳香物质分为 3 类,以其中心点作为各类物质
的代表,将所得代表与第一组评酒员评价结果进行多元回归分析,聚类分析的理
论基础如下:
假设在平面上有 n 个样本点,分别记为 1 , 2 , , n ,设
  w 1 , w 2 ,  , w n
聚类步骤如下
step 1 :计算个样本点两两之间的距离 d ij ,记为矩阵 D ( d ij ) n n
step 2 :首先构造 n 个类,每一类中只包含一个样本点,每一类的平台高度
均为零;
step 3 :合并距离最近的两类为新类,并且以这两类间的距离值作为聚类图
中的平台高度;
step 4 :计算新类与当前各类的距离,若类的个数已经等于 1 ,转入 step 5
否则,回到 step 3
step 5 :画聚类图;
step 6 :决定类的个数和类;
上述系统归类过程与计算类和类之间的距离有关,采用不同的距离定义,有 16
可能得出不同的聚类结果。
如果有两个样本类 G 1 G 2 ,该题采用重心法度量它们间的距离,其表达书
如下:
D ( G 1 , G 2 ) d ( x , y )
其中, x , y 代表 G 1 , G 2 的重心。
再次,以两次多元回归分析的残差作为评价葡萄酒的质量的标准。接着,于
变量上增加一进行灵敏度分析,检验灵敏度大小。
5.4.2 模型求解
以白葡萄的香气为例,首先根据第三问的葡萄酒理化指标进行回归分析,可
以得出如下表的标准化系数:
10 标准化系数
标准化系数
标准化系数
单宁
-0.036
白藜芦醇
0.203
总酚
-0.351
DPPH 半抑制体积
IV50
0.334
酒总黄酮
-0.295
色泽
-0.813
组间均方与组内均方的比值为 12.97 ,标准残差值 0.839
由此得到如下函数表达式:
y   0.036 x 1 0.351 x 2 0.295 x 3 0.203 x 4 0.334 x 5 0.813 x 6
其中 x 1 为单宁, x 2 为总酚, x 3 为酒总黄酮, x 4 为白藜芦醇, x 5 DPPH 半抑制
体积 (IV50) x 6 为色泽表示数, y 为香气质量。
使用主成分分析法对理化指标中酿酒葡萄与葡萄酒进行整合,由第三问的主
成分分析表可以得知,在白葡萄酒之中成分最重的有单宁、葡萄总黄酮、总酚、
蛋白质、总糖、酒石酸、苹果酸、多酚氧化酶活力、出汁率、还原糖、果穗质量
11 个指标将这是一个指标带入再次进行回归分析,所得结果如下表所示:
11 酿酒葡萄和葡萄酒主要理化指标的标准化系数
标准化系数
标准化系数
单宁
0.61
苹果酸
0.344
葡萄总黄酮
-1.352
多酚氧化酶活力
0.029
总酚
0.284
出汁率
-0.203
蛋白质
-0.061
还原糖
-0.088
总糖
-0.024
果穗质量
0.046
酒石酸
-0.199
组间均方与组内均方的比值为 24.16 ,标准残差值 0.772 。得到其函数表达式:
7 8 9 10 11
1 2 3 4 5 6
0.344 0.029 0.203 0.088 0.046
0.61 1.352 0.284 0.061 0.024 0.199
x x x x x
y x x x x x x
    
     
其中 x 1 为单宁, x 2 为葡萄总黄酮, x 3 为总酚, x 4 为蛋白质, x 5 为总糖, x 6 为酒
石酸, x 7 为苹果酸, x 8 为多酚氧化酶活力, x 9 为出汁率, x 10 为还原糖, x 11 为果
穗质量, y 为香气质量。
由组间均方与组内均方的比值与标准残差值可以直观得出经过整合后,拟合
效果变高。以上即为理化指标对白葡萄酒香气质量的影响主要影响指标有单宁,
葡萄总黄酮,总酚,蛋白质,总糖,酒石酸,苹果酸,多酚氧化酶活力,出汁率, 17
还原糖,果穗质量,同理可得理化指标对红葡萄酒香气质量的影响主要影响指标
有花色苷,褐变度,单宁,葡萄总黄酮,总酚,蛋白质,总糖,酒石酸,苹果酸,
多酚氧化酶活力,还原糖。
其次,基于聚类分析法将各类芳香物质分为 3 类,以其中心点作为各类物质
的代表。以白葡萄酒为例,先使用整合主成分计算出与质量的组间均方与组内均
方的比值与标准残差值,其中分别为 34.70 0.770 。使用系统聚类,没有检测出
来的数值使用 0 代替,白葡萄当中可以分为 19 类,其中类型中主要代表如下表
所示:
12 芳香物质中主要代表
乙醛
(Z)-2- 庚烯醛
乙酸乙酯
(Z)-3- 己烯 -1-
(E)-2- 已烯醛
邻二甲苯
2- 辛酮
柠檬烯
1- 辛醇
5- 甲基糠醛
甲氧基苯基丙酮肟
壬醛
2- 苯乙基乙酸酯
乙酸辛酯
苯乙醇
1- 甲氧基 -4- 1- 丙烯基)苯
乙酸戊酯
己酸乙酯
1- 庚醇
以其中心点作为各类物质的代表,将所得代表与第一组评酒员评价结果进行
多元回归分析,所得结果如下表:
13 标准化系数
标准化系数
C8H16O(2- 辛酮 )
0.462
C11H22O2( 壬酸乙酯 )
-0.409
C8H8O( 苯乙醛 )
-0.352
其中组间均方与组内均方的比值为 40.66 ,标准残差值 0.643
由此得到如下函数表达式:
y 0.462 x 1 0.409 x 2 0.352 x 3
其中 x 1 2- 辛酮, x 2 为壬酸乙酯, x 3 为苯乙醛。
通过组间均方与组内均方的比值与标准残差值对比,可以发现芳香物质对香
气质量的反应更加剧烈,因此理化指标不能完全来评价葡萄酒的质量的问题。
接着,于变量上增加一进行灵敏度分析,表达式系数改变量最大为 0.23 ,灵
敏度较低。
5.4.3 问题结论
针对问题四,建立了基于多元回归分析的评价模型,解决了各类理化指标与
葡萄酒质量关系的构建问题,并论证能否用各类理化指标来评价葡萄酒的质量。
首先,基于主成份分析法对酿酒葡萄的理化指标进行降维,将酿酒葡萄和葡萄酒
的主成份合并,将所得主成份与第一组评酒员所评结果进行多元回归分析,所得
结果如下:
0.344 0.029 0.203 0.088 0.046 .
0.61 1.352 0.284 0.061 0.024 0.199
7 8 9 10 11
1 2 3 4 5 6
x x x x x
y x x x x x x
    
      其次,基于聚类分析法将各类芳香物质分为 3 类,以其中心点作为各类
物质的代表,将所得代表与第一组评酒员评价结果进行多元回归分析,所得结果
如下:
y 0.462 x 1 0.409 x 2 0.352 x 3 .
再次,以两次多元回归分析的残差作为评价葡萄酒的质量的标准,所得结果
为: 0.770 0.643 ,残差相近,不能完全来评价葡萄酒的质量。接着,于变量上
增加一进行灵敏度分析,表达式系数改变量最大为 0.23 ,灵敏度较低。
5.4.4 检验分析
基于最小二乘法与评出的结果进行拟合,将所得主成份与第一组评酒员所评
结果进行拟合,得到如下的函数表达式:
y 0.3 x 1 1.3561 x 2 0.2942 x 3 0.066 x 4 0.019 x 5 0.201 x 6
0.355 x 7 0.034 x 8 0.213 x 9 0.091 x 10 0.039 x 11 .
基于聚类分析法将各类芳香物质分为 3 类,以其中心点作为各类物质的代表
将所得代表与第一组评酒员评价结果进行拟合,所得结果如下:
y 0.312 x 1 0.379 x 2 0.371 x 3 .
表达式系数改变量最大为 0.31 ,证明了模型的合理性。
5.4.5 小结
针对问题四,建立了基于多元回归分析的评价模型,解决了各类理化指标与
葡萄酒质量关系的构建问题,并论证能否用各类理化指标来评价葡萄酒的质量。
首先,基于主成份分析法对酿酒葡萄的理化指标进行降维,将酿酒葡萄和葡萄酒
的主成份合并,将所得主成份与第一组评酒员所评结果进行多元回归分析,得到
如下表达式:
y 0.3 x 1 1.3561 x 2 0.2942 x 3 0.066 x 4 0.019 x 5 0.201 x 6
0.355 x 7 0.034 x 8 0.213 x 9 0.091 x 10 0.039 x 11 .
其次,基于聚类分析法将各类芳香物质分为 3 类,以其中心点作为各类物质
的代表,将所得代表与第一组评酒员评价结果进行多元回归分析,所得结果如下:
y 0.462 x 1 0.409 x 2 0.352 x 3 .
再次,以两次多元回归分析的残差作为评价葡萄酒的质量的标准,所得结果
为: 0.765 0.632 ,残差相近,不能完全来评价葡萄酒的质量。接着,于变量上
增加一进行灵敏度分析,表达式系数改变量最大为 0.23 ,灵敏度较低。最后,基
于最小二乘法与评出的结果进行拟合,表达式系数改变量最大为 0.31 ,证明了模
型的合理性。
六、 模型评价与推广
6.1 模型评价
1 、对于问题一的模型,建立了基于 KW 检验和信度分析的评价模型,解决
了评价结果是否具有显著性差异和可信度的问题。其中 KW 检验基于对样本排序
并计算秩次,然后比较两组样本的秩和,从而得出结论,适用于两组独立样本且
样本数量足够大的情况下使用十分契合该题的分析。
18 2 、对于问题二的模型,建立了建立了基于聚类分析的评价模型,解决了对
酿酒葡萄进行分级的问题。其中将质量分类为香气质量和口感质量,基于皮尔森
相关系数得出两者与酿酒葡萄的理化性质指标之间的相关性,筛选出高相关性的
指标的举措极大地简化了数据处理的难度。同时根据信度的权重采用熵权法引入
打分制度,得出葡萄酒的综合评价得分将酿酒葡萄的品质可视化。并且应用了问
题一处理的信度指标,层层递进。
3 、对于问题三的模型,建立了基于主成份分析法的评价模型,解决了酿酒
葡萄与葡萄酒的理化指标之间的联系问题。其中主成份分析法的运用,利用降维
技术用少数几个综合变量来代替原始多个变量,同时这些综合变量集中了原始变
量的大部分信息,达到简化无关变量的目的。同时基于最小二乘法的拟合简单明
了地呈现出酿酒葡萄与葡萄酒的理化指标之间的联系。
4、对于问题四的模型,建立了基于多元回归分析的评价模型,解决了各类
理化指标与葡萄酒质量关系的构建问题,并论证能否用各类理化指标来评价葡萄
酒的质量。其中针对葡萄和葡萄酒繁杂的理化指标,均采用主成份分析法进行降
维,达到简化无关变量的目的。针对类别更加繁杂的芳香物质,采用聚类分析进
行简化。最后以两次多元回归分析的残差作为评价葡萄酒的质量的标准,客观地
衡量葡萄和葡萄酒的理化指标以及葡萄和葡萄酒的芳香物质对葡萄酒的质量的
影响,由此确定能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
6.2 模型推广
针对葡萄酒的评价模型,该模型针对葡萄酒品鉴标准研究对象进行分类,同
时在葡萄酒质量评估过程中,运用聚类分析和主成份分析等方法对葡萄酒品感官
品鉴进行具体外观、香气、口感分项研究,主要是通过不同葡萄酒的外观颜色及
浓度、香气等反馈特征进行统计分类呈现,从酿酒葡萄的质量等级评价视角来深
入研究葡萄酒品鉴标准及质量等级对葡萄酒产业营销需求的影响,尤其是对葡萄
品种特有的香气等融合口感的各种物质运用此类方法进行探究。能够实现对葡萄
酒质量品鉴的实际分类统计,有效完善葡萄酒质量评估体系,更好地研究葡萄酒
质量评估的相关指标,也在区域经济发展导向具有重要的现实意义。
参考文献
[1] 薛光明,宁鹏,钱明军等.基于改进平均秩的最小二乘参数估计方法 [J] .机械
强度, 2023,45(02):380-385.
[2] 于长春.秩和检验— Kruskal-Wallis 法和 Nemenyi 法在科室医疗质量动态监测
中的应用 [J] .中国医院统计, 2009,16(01):51-53.
[3] 席仲恩,汪顺玉.论负克伦巴赫 alpha 系数和分半信度系数 [J] .重庆邮电大学
学报(自然科学版), 2007(06):785-787.
[4]Chunyan L,Daniel J. Outlier Detection Using t-test in Rasch IRT Equating under
NEAT Design[J]. Applied Psychological Measurement, 2023, 47(1).
[5] 纪德洋,金锋,冬雷等.基于皮尔逊相关系数的光伏电站数据修复 [J] .中国电机
工程学报, 2022, 42 (04): 1514-1523.
[6] 覃源,吕杲,关科等.基于熵权法的混凝土耐久性评价及寿命预测 [J] .硅酸盐学
报, 2023, 51 (05): 1344-1354.
[7] 赵上勇,周志明,宋超等.基于 LIBS 技术人参样品聚类分析及重金属检测研究
[J] .光谱学与光谱分析, 2020, 40 (08): 2629-2633.
19 [8] 王钰豪,刘建国,徐亮等.主成分分析在温室气体时序红外光谱处理中的应用
研究 [J] .光谱学与光谱分析, 2023, 43 (07): 2313-2318.
[9] 郭翔,刘奇.基于主成份分析的我国应急科技支撑能力评价研究 [J] .科技管理
研究, 2014, 34(20): 48-51+69.
[10] 陈桂廷,王真理.基于插值原理的检查点技术波场重构与叠前逆时偏移 [J] .地
球物理学报, 2018, 61 (08): 3334-3345.
[11] 李永明,王亮,陈想林等. ~(252)Cf 自发裂变中子发射率符合测量的回归分析
[J] .物理学报, 2018, 67 (24): 106-111.
[12] 孙丰,徐贺,赵宇晗等.数据驱动的基于数学模型插补和改进深度残差收缩网
络的调节阀状态监控 ( 英文 )[J].Journal of Zhejiang University-Science A(Applied
Physics & Engineering), 2022, 23 (04): 303-314.
[13] 麻仲凯,李茂刚,闫春华等.拉曼光谱结合偏最小二乘法在柴油正丁醇快速定
量分析中的应用 [J] .光谱学与光谱分析, 2023, 43 (07): 2153-2157.
20 21
附 录
附录一 问题一的代码
检验
[f_ecdf,xc]=ecdf(score);
figure;
ecdfhist(f_ecdf,xc,7);
hold on;
% 调用 ksdensity 函数进行核密度估计
[f_ks1,xi1,u1]=ksdensity(score);
plot(xi1,f_ks1,'k','linewidth',3)
% 计算 xi1 处的正态分布密度函数值,正态分布的均值为 55 ,标准差为 10
f_norm=normpdf(xi1,55,10);
% 绘制正态分布密度函数图,并设置线条为红色点划线,线宽为 3
plot(xi1,f_norm,'r-.','linewidth',3)
legend(' 频率直方图 ',' 核密度估计图 ',' 正态分布密度图 ','Location','NorthWest')
u1 % 查看窗宽
附录二问题二的代码
主成分分析法
clc,clear
data = xlsread('3 预处理( 1 .xlsx','hgx','A8:E35');% 将原始数据保存在 txt 文件中
data=zscore(data);
% 数据的标准化
r=corrcoef(data);
% 计算相关系数矩阵 r
% 下面利用相关系数矩阵进行主成分分析, vec1 的第一列为 r 的第一特征向量,
即主成分的系数
[vec1,lamda,rate]=pcacov(r);
%lamda r 的特征值, rate 为各
个主成分的贡献率
f=repmat(sign(sum(vec1)),size(vec1,1),1);
% 构造与 vec1 同维数的元素为 ±1
矩阵
vec2=vec1.*f;
% 修改特征向量的正负号,使得每个特征向量的分量
和为正,即为最终的特征向量
num = max(find(lamda>1)); %num 为选取的主成分的个数 , 这里选取特征值大于 1
df=data*vec2(:,1:num);
% 计算各个主成分的得分 22
tf=df*rate(1:num)/100;
% 计算综合得分
[stf,ind]=sort(tf,'descend'); % 把得分按照从高到低的次序排列
stf=stf'; ind=ind';
%stf 为得分从高到低排序, ind 为对应的样本编号
clc,clear
data = xlsread('3 预处理( 1 .xlsx','bgx','S39:W66');% 将原始数据保存在 txt 文件中
data=zscore(data);
% 数据的标准化
r=corrcoef(data);
% 计算相关系数矩阵 r
% 下面利用相关系数矩阵进行主成分分析, vec1 的第一列为 r 的第一特征向量,
即主成分的系数
[vec1,lamda,rate]=pcacov(r);
%lamda r 的特征值, rate 为各
个主成分的贡献率
f=repmat(sign(sum(vec1)),size(vec1,1),1);
% 构造与 vec1 同维数的元素为± 1
的矩阵
vec2=vec1.*f;
% 修改特征向量的正负号,使得每个特征向量的分量
和为正,即为最终的特征向量
num = max(find(lamda>1)); %num 为选取的主成分的个数 , 这里选取特征值大于 1
df=data*vec2(:,1:num);
% 计算各个主成分的得分
tf=df*rate(1:num)/100;
% 计算综合得分
[stf,ind]=sort(tf,'descend'); % 把得分按照从高到低的次序排列
stf=stf'; ind=ind';
%stf 为得分从高到低排序, ind 为对应的样本编号
熵权法
clc
clear
R=xlsread('2 预处理 (1).xlsx','b4','C3:O30')
data = R;
[Y,PS] = mapminmax(data',0,1);% 由于此函数是按行进行归一化的,因此先转置再
转回来就好了
to_one = Y';
ele_weight = [];
sum_col = sum(to_one); % 默认按列求和
[row, col] = size(to_one); % 获取原数据矩阵的行和列
for i = 1:row for j = 1:col
ele_weight(i,j) = to_one(i,j)/sum_col(j); % 计算出归一化后每个元素在所
在特征列的占比
end
end
E_ele = [];
for i = 1:row
for j = 1:col
if ele_weight(i,j) == 0 % 规定 0*ln(0) = 0, 不赋值默认为 0
continue
end
E_ele(i,j) = -ele_weight(i,j)*log(ele_weight(i,j));% 计算信息熵
end
end
clc
clear
R=xlsread('2 预处理 (1).xlsx','b3','C3:R30')
data = R;
[Y,PS] = mapminmax(data',0,1);% 由于此函数是按行进行归一化的,因此先转置再
转回来就好了
to_one = Y';
ele_weight = [];
sum_col = sum(to_one); % 默认按列求和
[row, col] = size(to_one); % 获取原数据矩阵的行和列
for i = 1:row
for j = 1:col
ele_weight(i,j) = to_one(i,j)/sum_col(j); % 计算出归一化后每个元素在所
在特征列的占比
end
end
E_ele = [];
for i = 1:row
23 for j = 1:col
if ele_weight(i,j) == 0 % 规定 0*ln(0) = 0, 不赋值默认为 0
continue
end
E_ele(i,j) = -ele_weight(i,j)*log(ele_weight(i,j));% 计算信息熵
end
end
E = sum(E_ele./log(row));% 计算此特征的信息熵
sum_E = sum(E);
W = (1-E)./(col-sum_E);% 通过信息熵计算对应特征的权重
W = W';% 转置便于矩阵乘法直接计算出对应的评价分数
data * W
clc
clear
R=xlsread('2 预处理 (1).xlsx','h4','C3:Q29')
data = R;
[Y,PS] = mapminmax(data',0,1);% 由于此函数是按行进行归一化的,因此先转置再
转回来就好了
to_one = Y';
ele_weight = [];
sum_col = sum(to_one); % 默认按列求和
[row, col] = size(to_one); % 获取原数据矩阵的行和列
for i = 1:row
for j = 1:col
ele_weight(i,j) = to_one(i,j)/sum_col(j); % 计算出归一化后每个元素在所
在特征列的占比
end
end
E_ele = [];
for i = 1:row
for j = 1:col
24 if ele_weight(i,j) == 0 % 规定 0*ln(0) = 0, 不赋值默认为 0
continue
end
E_ele(i,j) = -ele_weight(i,j)*log(ele_weight(i,j));% 计算信息熵
end
end
E = sum(E_ele./log(row));% 计算此特征的信息熵
sum_E = sum(E);
W = (1-E)./(col-sum_E);% 通过信息熵计算对应特征的权重
W = W';% 转置便于矩阵乘法直接计算出对应的评价分数
data * W
R=xlsread('2 预处理 (1).xlsx','h3','C3:R29')
data = R;
[Y,PS] = mapminmax(data',0,1);% 由于此函数是按行进行归一化的,因此先转置再
转回来就好了
to_one = Y';
ele_weight = [];
sum_col = sum(to_one); % 默认按列求和
[row, col] = size(to_one); % 获取原数据矩阵的行和列
for i = 1:row
for j = 1:col
ele_weight(i,j) = to_one(i,j)/sum_col(j); % 计算出归一化后每个元素在所
在特征列的占比
end
end
E_ele = [];
for i = 1:row
for j = 1:col
if ele_weight(i,j) == 0 % 规定 0*ln(0) = 0, 不赋值默认为 0
continue
end
25 E_ele(i,j) = -ele_weight(i,j)*log(ele_weight(i,j));% 计算信息熵
end
end
E = sum(E_ele./log(row));% 计算此特征的信息熵
sum_E = sum(E);
W = (1-E)./(col-sum_E);% 通过信息熵计算对应特征的权重
W = W';% 转置便于矩阵乘法直接计算出对应的评价分数
data * W
皮尔斯相关性
clc
clear
X=xlsread('3 预处理 .xlsx','h','B2:AE28')
Y=xlsread('3 预处理 .xlsx','h','AG2:AO28')
pearson_corr = corr(X, Y)
clc
clear
X=xlsread('3 预处理 .xlsx','b','B2:AE29')
Y=xlsread('3 预处理 .xlsx','b','AG2:AN29')
pearson_corr = corr(X, Y)
聚类分析
clc
clear
a=xlsread('4 预处理 .xlsx','sheet1','A1:AA73');
d1=pdist(a);% 此时计算出各行之间的欧氏距离,
z1=linkage(d1);
z2=linkage(d1,'complete');
26 27
z3=linkage(d1,'average');
z4=linkage(d1,'centroid');
z5=linkage(d1,'ward');
R=[cophenet(z1,d1),cophenet(z2,d1),cophenet(z3,d1),cophenet(z4,d1),cophenet(z5,d1)
]
H= dendrogram(z3)
T=cluster(z3,4)
附录三问题三的代码
Q 型聚类分析
clc,clear;
a=xlsread(' 处理数据 .xlsx','sheet1','A1:E28'); % 处理数据矩阵,可变化,拿以上数
据举例
a=zscore(a);
% 数据标准化处理
y=pdist(a,'cityblock');
% a 的行向量之间的绝对距离 , 关于 pdist 函数下面有介
yc=squareform(y);
% 变换成距离方阵
z=linkage(y);
% 产生等级聚类图
[h,t]=dendrogram(z);
% 画聚类图
T=cluster(z,'maxclust',3);% 把对象分成 3 份,参数可自行修改成 2,4,5 等,记得将
下一行 i 值修改
for i=1:3;
tm=find(T==i);
% 求第 i 类的对象
tm=reshape(tm,1,length(tm));% 变成行向量
fprintf(' %d 类的有 %s\n',i,int2str(tm));% 显示分类结果
End
最小二乘法
clc
clear
y=xlsread('3 预处理 .xlsx','h','AG2:AG29');
x=xlsread('3 预处理 .xlsx','h','G2:G29');
x=x'
y=y'
[~,k]=size(x);
for n=4
% 改变阶数
X0=zeros(n+1,k); 28
for k0=1:k
% 构造矩阵 X0
for n0=1:n+1
X0(n0,k0)=x(k0)^(n+1-n0);
end
end
X=X0';
ANSS=(X'*X)\X'*y';
for i=1:n+1
%answer 矩阵存储每次求得的方程系数,按列存储
answer(i,n)=ANSS(i);
end
x0=0:0.01:17;
y0=ANSS(1)*x0.^n
;% 根据求得的系数初始化并构造多项式方程
for num=2:1:n+1
y0=y0+ANSS(num)*x0.^(n+1-num);
end
plot(x,y,'*')
hold on
plot(x0,y0)
end
suptitle(' 单宁 - 单宁曲线拟合结果 ')
附录四问题四的代码
Q 型聚类分析
clc,clear;
a=xlsread(' 处理数据 .xlsx','sheet1','A1:E28'); % 处理数据矩阵,可变化,拿以上数
据举例
a=zscore(a);
% 数据标准化处理
y=pdist(a,'cityblock');
% a 的行向量之间的绝对距离 , 关于 pdist 函数下面有介
yc=squareform(y);
% 变换成距离方阵
z=linkage(y);
% 产生等级聚类图
[h,t]=dendrogram(z);
% 画聚类图
T=cluster(z,'maxclust',3);% 把对象分成 3 份,参数可自行修改成 2,4,5 等,记得将
下一行 i 值修改
for i=1:3;
tm=find(T==i);
% 求第 i 类的对象
tm=reshape(tm,1,length(tm));% 变成行向量
fprintf(' %d 类的有 %s\n',i,int2str(tm));% 显示分类结果
End
主成分分析
clc,clear
data = xlsread('3 预处理( 1 .xlsx','bgx','Y39:AC66');% 将原始数据保存在 txt 文件
data=zscore(data);
% 数据的标准化
r=corrcoef(data);
% 计算相关系数矩阵 r
% 下面利用相关系数矩阵进行主成分分析, vec1 的第一列为 r 的第一特征向量,
即主成分的系数 29
[vec1,lamda,rate]=pcacov(r);
%lamda r 的特征值, rate 为各
个主成分的贡献率
f=repmat(sign(sum(vec1)),size(vec1,1),1);
% 构造与 vec1 同维数的元素为± 1
的矩阵
vec2=vec1.*f;
% 修改特征向量的正负号,使得每个特征向量的分量
和为正,即为最终的特征向量
num = max(find(lamda>1)); %num 为选取的主成分的个数 , 这里选取特征值大于 1
df=data*vec2(:,1:num);
% 计算各个主成分的得分
tf=df*rate(1:num)/100;
% 计算综合得分
[stf,ind]=sort(tf,'descend'); % 把得分按照从高到低的次序排列
stf=stf'; ind=ind';
%stf 为得分从高到低排序, ind 为对应的样本编号
多元回归分析
Resemblance=corrcoef(Data);
% 得到系数
相关矩阵
[Row,Col]=size(Resemblance);
% 得到
Resemblance 矩阵的行和列
site=[];count=0;
%
for row=1:(Row-1)
% 得到总能
源与哪些因素有关
if(abs(Resemblance(row,Col))>0.4)
disp([' 总能源与第 ' num2str(row) ' ' str(row) ' 相关度较高,相关系数为 '
num2str(Resemblance(Col,row)) ]);
count=count+1;
% 保存相
关变量的数量
site(count)=row;
% 保存相关
变量的列地址
end
end
4 红葡萄酒权重
红葡萄酒权重
是否为负
蛋白质
0.055924707
花色苷
0.087423469
DPPH 自由基 1/IC50
0.055394382
总酚
0.069789429
单宁
0.058746739
葡萄总黄酮
0.076535542
白藜芦醇
0.128993859
黄酮醇
0.137515519
还原糖
0.034974723
可溶性固形物
0.038415079
PH
0.025906699
可滴定酸
0.046544728
固酸比
0.054002601
30
干物质含量
0.027539058
果梗比
0.065064381
出汁率
0.037229084
5 高相关性的指标和综合评价得分
香气评分
口感评分
平均值
葡萄样品 3
90.81133893
100 95.40566946
葡萄样品 9
100
31.70550658 65.85275329
葡萄样品 21
55.38212326
75.14032673
65.261225
葡萄样品 1
94.98790526
26.83054608 60.90922567
葡萄样品 8
94.24785181
27.46735892 60.85760536
葡萄样品 2
80.41288871
28.93073358 54.67181115
葡萄样品 14
86.45538175
20.35567489 53.40552832
葡萄样品 23
73.3690613
31.61400876 52.49153503
葡萄样品 19
56.3600332
31.86177689 44.11090505
葡萄样品 5
55.94608754
24.90386475 40.42497614
葡萄样品 13
57.94799228
20.88331837 39.41565532
葡萄样品 6
36.8183368
41.94677793 39.38255736
葡萄样品 24
52.99973708
22.4266571 37.71319709
葡萄样品 4
45.60372268
28.03181998 36.81777133
葡萄样品 22
39.83867641
32.24833329 36.04350485
葡萄样品 10
51.76161202
19.78797537 35.77479369
葡萄样品 16
49.63427006
21.75847657 35.69637332
葡萄样品 11
41.01341177
30.37897381 35.69619279
葡萄样品 17
46.02933274
23.91165417 34.97049346
葡萄样品 15
40.13090226
28.2086905 34.16979638
葡萄样品 20
38.77935705
29.52143911 34.15039808
葡萄样品 25
47.87685715
20.12311402 33.99998558
葡萄样品 26
48.85821002
13.90630453 31.38225727
葡萄样品 7
31.1405147
30.11392178 30.62721824
葡萄样品 18
30.55955197
30.25760291 30.40857744
葡萄样品 12
25.61546411
31.89788265 28.75667338
葡萄样品 27
38.13033645
16.53843723 27.33438684
6 葡萄酒品尝平均评分与所分葡萄等级对比
样品编号
品尝平均评分
划分等级
1
7.7
一级
2
9.6
二级
3
9.4
一级
4
8.4
二级
5
8.6
二级
6
8.6
二级
7
8.9
三级
8
8.4
一级
9
9.7
一级
10
8.4
二级 31
11
8.4
二级
12
7.9
三级
13
8.9
二级
14
8.9
二级
15
7.6
三级
16
9.1
二级
17
9.2
三级
18
7.9
三级
19
9.2
二级
20
9.2
三级
21
9.2
一级
22
9.0
二级
23
10.0
二级
24
9.1
二级
25
8.3
三级
26
8.9
三级
27
9.0
三级
7 关于葡萄酒理化指标的皮尔森相关系数
单宁
出汁率
-0.294445658
果穗质量
0.071005835
百粒质量
0.040863275
果皮质量
0.372780129
可滴定酸
0.056329161
VC 含量
-0.165644502
总酚
0.428391212
葡萄总黄酮
0.495083649
苹果酸
0.04619018
蛋白质
0.361943798
果梗比
-0.349001017
褐变度
-0.053646422
多酚氧化酶活力
-0.236772423
DPPH 自由基 1/IC50
0.409397436
花色苷
-0.21653397
柠檬酸
0.248192744
a *(+红;-绿)
0.030689269
L *
0.060334854
黄酮醇
0.410693429
单宁
0.573832337
b *(+黄;-蓝)
-0.08229862
酒石酸
0.181571586
PH
0.174026703
白藜芦醇
-0.06160506
固酸比
0.03942735 32
氨基酸总量
0.427816661
还原糖
0.093307294
总糖
0.355296547
可溶性固形物
0.348545016
干物质含量
0.228986514
第三问的算式
总酚与葡萄总黄酮的函数表达式:
y 1   0 .0019 x 4 0 .0427 x 3 0 .3040 x 2 0 .8690 x 0 .4723
总酚与葡萄总黄酮的函数表达式:
y 2   0 .0011 x 4 0 .0409 x 3 0 .5314 x 2 2 .7085 x 5 .8645
总酚与单宁的函数表达式:
y 3   0 .0091 x 4 0 .2192 x 3 1 .7629 x 2 5 .7114 x 4 .9218
总酚与总酚的函数表达式:
Y 0.53 y 1 0.21 y 2 0.15 y 3
酒总黄酮与总酚的函数表达式:
y 1 0.0015 x 4 0.0543 x 3 0.6810 x 2 3.2789 x 5.9502
酒总黄酮与葡萄总黄酮的函数表达式:
y 2   0.0069 x 4 0.1098 x 3 0.5826 x 2 0.8708 x 0.9565
酒总黄酮与蛋白质的函数表达式:
y 3 0.0173 x 7.1734
Y 0.61 y 1 0.19 y 2 0.11 y 3
白藜芦醇与总糖的函数表达式:
y 1   0.0050 x 1.3264
白藜芦醇与酒石酸的函数表达式:
y 2 0.0019 x 4 0.0617 x 3 0.7475 x 2 3.9311 x 7.8807
白藜芦醇与苹果酸的函数表达式:
y 3   0 .0006 x 4 0 .0106 x 3 0 .0402 x 2 0 .0689 x 0 .6716
白藜芦醇与 L*的函数表达式:
y 4   0 .0006 x 4 0 .0832 x 3 4 .6756 x 2 116 .2521 x 1077 .7523
Y 0.29 y 1 0.29 y 2 0.22 y 3 0.14y 4
DPPH 半抑制体积 IV50 与总酚的函数表达式: y 1 0.0001 x 4 0.0022 x 3 0.0284 x 2 0.1461 x 0.2994
DPPH 半抑制体积( IV50 )与葡萄总黄酮的函数表达式:
y 2   0.0002 x 4 0.0033 x 3 0.0219 x 2 0.0536 x 0.0085
DPPH 半抑制体积( IV50 )与多酚氧化酶活力的函数表达式:
y 3   0.0008 x 0.0766
Y 0.56 y 1 0.2 y 2 0.14 y 3
L* 与出汁率的函数表达式:
y 1   0.0011 x 2 0.1903 x 93 .6777
L* 与还原糖的函数表达式:
y 2   0.0001 x 2 0.0153 x 100 .9012
Y 0.68 y 1 0.13 y 2
a*(+ 红; - 绿 ) 与出汁率的函数表达式:
y 1   0.0011 x 2 0.1758 x 7.3798
a*(+ 红; - 绿 ) 与与果穗质量的函数表达式:
y 2 0.0010 x 0.8449
a*(+ 红; - 绿 ) 与与葡萄总黄酮的函数表达式:
y 3 0 .0015 x 4 0 .0352 x 3 0 .2724 x 2 0 .7408 x 0 .1184
Y 0.43 y 1 0.28 y 2 0.12 y 3
33
  • 10
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

墨墨祺

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值