大数据分析课设----新冠病例预测

        由于自己是大数据专业,而且自己对这方面也比较感兴趣,奈何目前没有多余的精力做这方面的研究,这里分享自己做过的一次课设,仅供学弟学妹们参考(狗头保命),题目有点老了。

       做这个课设的时候才大二,对深度学习还没有清楚的认识,就是简单的实现了几个模型。但是足够应付课设了,报告写了4w字,都能当一个小论文了,当时这门实践课得了98分,现在看来,好像也没啥含金量。

        毕设做的是自然语言处理-属性级情感分析(基于LSTM和注意力机制),有空了也会分享出来给学弟学妹们参考。

任务介绍、数据集、环境介绍

1、 任务介绍:给40个州的前三天的features(以及前两天的label,即新冠确诊)预测第三天的新冠确诊

2、数据集介绍:

数据集介绍:训练数据2700例,测试数据893例(最后一列未知,需要模型预测)。

40个州(one-hot编码形式)+第一天的features+第一天label+第二天features+第二天label+第三天的features+第三天的label

  • 0列是id
  • 1-40列是40个州的one-hot编码
  • 41-44COVID-like illness
  • 45-52Behavior Indicators
  • 53-58Mental Health Indicators
  • 59是最后检测结果,阳不阳
  • 后续是第2-3天的特征数据,都写成列

这里是数据集

链接:https://pan.baidu.com/s/1GQcLgJZ8iMD-KdF6Q7YSFw?pwd=kkud 
提取码:kkud 

使用环境:Jupyter Notebook

课设主要实现的内容

1、数据预处理:

        删除无用列、特征值切分、数据集划分、标准化处理、转换数据类型等,方便数据分析。

2、相关性分析特征值的选取:

        使用Pandas库(pandas)中corr()函数计算了40个州、第一天特征数据、第二天特征数据、第三天特征数据和目标变量之间的相关系数矩阵。该方法显示了每对变量之间的线性相关程度,可以理解变量之间的关系,并使用Seaborn库的heatmap函数创建热力图,分别绘制了相关系数矩阵热力图。

        通过Scikit-learn库中的f_regression函数计算特征与目标变量之间的相关性并返回了特征值与分数,然后通过Scikit-learn库中的SelectKBest类,根据指定的评分函数选择最重要的k个特征。本次实验使用SelectKBest选取了30个特征值。

        最终通过综合分析相关系数矩阵热力图与f_regression函数得到的相关性分数,选取了29个特征值进行模型训练。

3、线性回归模型

        简述了线性回归模型的原理以及公式,说明了线性回归模型是如何定义的,并详细描述了模型的训练过程,包括参数设置、模型初始化、优化器选择等,通过优化器选择和添加L1正则化优化了模型,并添加了RMSE指标,通过可视化分析进行了参数调整。

4、多层感知机模型

        简述了多层感知机模型的原理以及公式,定义了多层感知机的模型,包括三个全连接层,并详细描述了模型的训练过程,包括参数设置、模型初始化、优化器选择等,通过可视化分析进行了参数调整。

5、循环神经网络

        简述了循环神经网络模型的原理以及公式,定义了一个简单的循环神经网络模型包括一个RNN层、一个全连接层,并详细描述了模型的训练过程,包括参数设置、模型初始化、优化器选择等,通过优化器选择和特征值选取优化了模型。

6、卷积神经网络

        简述了卷积神经网络模型的原理以及公式,定义了卷积神经网络模型,包括2个卷积层,每个卷积层还包含一个最大化池,以及一个展平层,一个全连接层,并详细描述了模型的训练过程,包括参数设置、模型初始化、优化器选择等,通过优化器选择、特征值选取和添加全连接层优化了模型。

源码以及报告

        报告大概4w字,相当于是一篇小论文了。

gitee地址

COVID-19: 大数据分析课设--新冠肺炎预测---给40个州的前三天的features(以及前两天的label,即新冠确诊)预测第三天的新冠确诊。 使用了线性回归模型、多层感知机模型、循环神经网络、卷积神经网络进行预测 (gitee.com)

GitHub地址

weihong13/COVID-19: 大数据分析课设--新冠肺炎预测---给40个州的前三天的features(以及前两天的label,即新冠确诊)预测第三天的新冠确诊。 使用了线性回归模型、多层感知机模型、循环神经网络、卷积神经网络进行预测 (github.com)

  • 22
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值