说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。
1.项目背景
线性混合效应模型是一类用于分析具有多层次结构或重复测量的数据的统计模型。它们结合了固定效应和随机效应,适用于在数据中存在不同层次的变异,例如来自不同实验单位、观察组或时间点的变异。允许我们在考虑随机效应的同时,仍然对固定效应进行推断和估计。
本项目通过mixedlm回归算法来构建线性混合效应回归模型。
2.数据获取
本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:
编号 | 变量名称 | 描述 |
1 | rownames | |
2 | Pig | |
3 | Evit | |
4 | Cu | |
5 | Litter | |
6 | Start | |
7 | Weight | |
8 | Feed | |
9 | Time |
数据详情如下(部分展示):
3.数据预处理
3.1 用Pandas工具查看数据
使用Pandas工具的head()方法查看前五行数据:
关键代码:
3.2 数据缺失查看
使用Pandas工具的info()方法查看数据信息:
从上图可以看到,总共有11个变量,数据中无缺失值,共2000条数据。
关键代码:
3.3 数据描述性统计
通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。
关键代码如下:
4.探索性数据分析
4.1 变量直方图
用Matplotlib工具的hist()方法绘制直方图:
从上图可以看到,Weight变量主要集中在20~120之间。
4.2 相关性分析
从上图中可以看到,数值越大相关性越强,正值是正相关、负值是负相关。
5.构建线性混合效应回归模型
主要使用线性混合效应回归算法,用于目标回归。
5.1 构建模型
编号 | 模型名称 | 参数 |
1 | 线性混合效应回归模型 | 默认参数 |
5.2 模型摘要信息
6.模型评估
6.1 剖面似然图
7.结论与展望
综上所述,本文采用了线性混合效应回归算法来构建回归模型,最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。