2022福大数学建模赛题B题-主成分分析和单因素方差分析-附python代码

题目4:一般食物所含成分可分为水分、能量、碳水化合物、膳食纤维、脂肪、蛋白质、维生 素、矿物质和胆固醇等九大类,你认为哪类成分对食物寒热性起到主要作用?这种作用对开发 以寒热性为原理的功能性食品有什么帮助?

思路:首先利用主成分分析方法分析主要的变量,再根据单因素分析方法看它们对因变量食物寒热性的影响。

简单介绍:

主成分分析法(Principal Component Analysis,PCA)是一种常用的多变量分析方法,
其主要主要是降维处理,并得出自变量的影响权重,主要步骤如下:
a.初始数据标准化处理,使得每个数据属性的均值为 0,方差为 1.
b.推导得出相关系数矩阵
c.计算相关系数矩阵的特征值及特征向量
d.计算主成分的贡献率/累计贡献率
e.得出主要成分的自变量

ANOVA方差分析的基本思想就是分析不同类别数据的差异对最终结果的影响大小,它确定
该数据对实验结果的重要性。它可用于检验食物成分对食物寒热性是否有显著影响

1、数据预处理。由于数据分成了9类,对于维生素B1,B2,烟酸等划为维生素族和钙铁等元素划为矿物质族,数据标准化后,重新构建的能量、水分、维生素、矿物质等 9类食物成分数据进行建模分析。

2、采用主成分分析模型,探究出主要自变量及其贡献度排序。

 

3、采用单因素方差分析来检验自变量对因变量寒热属性的分类是否具有显著性影响。原假设:性平,性寒和性热的各个食物成分无显著差异可得能量、水分、碳水化合物和脂肪的 p值都接近 0,远小于 0.05水平,它们对食物寒热性起到主要作用。结合多重比较的田口法来判断两两类别之间的显著性差异。

 多重比较田口法

4、性平、性凉寒和性温热分类中的食物成分描述性统计

 

5、得出结论。能量、碳水化合物和脂肪的含量越高,食物属性越趋向于性平,当水分含量越大,食物属性越趋向于性凉寒。

python源代码:

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn import preprocessing
import re
from scipy import stats

##------------读取数据----------
df1 = pd.read_excel(r'食物成分表.xlsx', 
  • 6
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值