2024年第三届钉钉杯大学生大数据挑战赛B题第1问

赛题:

问题1:

针对康复医学科一病房,以日期、患者人数、药品总收入、当日病房收入为基础输入数据,构建2个不同类型的时间序列预测模型,分别预测对应的门诊收入数据,目标为表中这个科室空白的数据。

为了完成第一小问的任务,即构建两个不同类型的预测模型来预测康复医学科一病房的门诊收入,我们将按照以下步骤进行:

  1. 数据预处理:清洗数据、填充缺失值、创建有用的特征。
  2. 探索性数据分析:可视化数据,理解数据分布和趋势。
  3. 模型构建:选择两种不同的模型,例如 ARIMA 和随机森林。
  4. 模型训练与评估:使用训练数据训练模型,并在测试数据上评估模型性能。

解题思路

首先,我们需要从 Excel 文件中读取数据,并选择康复医学科一病房的相关数据进行分析。我们需要关注的列包括:

  • 日期
  • 门诊患者人次数
  • 门诊收入 OBS_T01_MZSR68
  • 药品总收入
  • 当日病房收入

接下来,我们进行数据预处理,确保数据格式正确,填充缺失值,创建有用的特征(例如提取日期中的月份、周几等信息)。

之后,我们构建两种不同类型的预测模型。一种可以是时间序列模型,例如 ARIMA,另一种可以是非时间序列模型,例如随机森林。

最后,我们将通过训练数据集训练这两个模型,并在测试数据集上评估它们的性能。

具体步骤

  1. 导入必要的库:Pandas、Numpy、Matplotlib、Seaborn、Statsmodels、Scikit-Learn 等。
  2. 加载数据:从 Excel 文件中读取数据。
  3. 数据预处理:清洗数据、处理缺失值、创建有用的特征。
  4. 探索性数据分析:绘制时间序列图,观察门诊收入的趋势。
  5. 模型构建:
  6. 构建 ARIMA 模型。
  7. 构建随机森林模型。
  8. 模型训练与评估:使用训练数据训练模型,并在测试数据上评估模型性能。

代码:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.arima.model import ARIMA
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import StandardScaler

# 1. 加载数据
data = pd.read_excel('数据.xlsx')

# 2. 数据预处理
# 选择康复医学科一病房的数据
ward_data = data[data['当日病房收入对应科室'] == '康复医学科一病房']

# 填充缺失值
ward_data.fillna(method='ffill', inplace=True)

# 创建有用的特征
ward_data['日期'] = pd.to_datetime(ward_data['日期'])
ward_data['Month'] = ward_data['日期'].dt.month
ward_data['DayOfWeek'] = ward_data['日期'].dt.dayofweek

# 准备训练和测试数据
X = ward_data[['门诊患者人次数', '药品总收入', '当日病房收入', 'Month', 'DayOfWeek']]
y = ward_data['门诊收入OBS_T01_MZSR68']

# 3. 探索性数据分析
plt.figure(figsize=(14, 7))
plt.plot(ward_data['日期'], ward_data['门诊收入OBS_T01_MZSR68'])
plt.title('门诊收入随时间的变化')
plt.xlabel('日期')
plt.ylabel('门诊收入')
plt.show()

# 4. 模型构建
# 4.1 ARIMA 模型
# 选择 p, d, q 参数
p = 1
d = 1
q = 1

# 4.2 随机森林模型
rf = RandomForestRegressor(n_estimators=100, random_state=42)

# 5. 模型训练与评估
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ARIMA 模型训练
# 需要将时间序列数据转换为监督学习格式
def series_to_supervised(data, n_in=1):
    df = pd.DataFrame(data)
    cols = list()
    for i in range(n_in, 0, -1):
        cols.append(df.shift(i))
    cols.append(df)
    agg = pd.concat(cols, axis=1)
    agg.dropna(inplace=True)
    return agg.values

values = ward_data['门诊收入OBS_T01_MZSR68'].values
supervised_data = series_to_supervised(values, 1)
train = supervised_data[:int(len(supervised_data)*0.8)]
test = supervised_data[int(len(supervised_data)*0.8):]

history = [x for x in train]
predictions = list()
for t in range(len(test)):
    model = ARIMA(history, order=(p,d,q))
    model_fit = model.fit()
    output = model_fit.forecast()
    yhat = output[0]
    predictions.append(yhat)
    obs = test[t]
    history.append(obs)
    print('predicted=%f, expected=%f' % (yhat, obs))

# 计算 MSE
mse = mean_squared_error(test[:, 0], predictions)
print('Test MSE: %.3f' % mse)

# 随机森林模型训练
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

rf.fit(X_train_scaled, y_train)

# 6. 评估模型性能
y_pred_arima = predictions
y_pred_rf = rf.predict(X_test_scaled)

# 计算 MSE
mse_arima = mean_squared_error(y_test, y_pred_arima)
mse_rf = mean_squared_error(y_test, y_pred_rf)

print('ARIMA Test MSE: %.3f' % mse_arima)
print('Random Forest Test MSE: %.3f' % mse_rf)

  • 10
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于使用Spring Boot实现钉钉第三方登录,你可以按照以下步骤进行操作: 1. 在钉钉开放平台注册应用:首先,在钉钉开放平台(https://open-dev.dingtalk.com/)上创建一个新的应用。在创建应用时,选择网页应用类型,并填写相关信息,如应用名称、应用描述、回调URL等。 2. 获取AppKey和AppSecret:创建应用成功后,你将获得一个AppKey和AppSecret,这是与钉钉服务器进行交互的凭证。 3. 配置Spring Boot项目:在你的Spring Boot项目,添加相应的依赖,如钉钉SDK(dingtalk-sdk-java),以便与钉钉服务器进行交互。你可以在项目的pom.xml文件添加以下依赖: ```xml <dependency> <groupId>com.dingtalk</groupId> <artifactId>dingtalk-sdk-java</artifactId> <version>2.0.2</version> </dependency> ``` 4. 实现登录逻辑:编写相应的代码来处理钉钉的登录逻辑。可以创建一个Controller来处理登录请求,然后在登录请求调用钉钉SDK提供的接口来获取用户信息。 ```java @RestController public class DingTalkLoginController { @Autowired private DingTalkClient dingTalkClient; @GetMapping("/login") public String login(@RequestParam("code") String code) { // 使用钉钉SDK获取用户信息 DingTalkClient.UserInfo userInfo = dingTalkClient.getUserInfo(code); // 在这里进行用户信息的处理和登录逻辑 return "登录成功"; } } ``` 5. 配置回调URL:在钉钉开放平台上,将回调URL配置为你的Spring Boot项目的登录接口URL,例如:http://localhost:8080/login。 6. 测试登录:启动你的Spring Boot应用,并在浏览器访钉钉登录页面,授权后将跳转到你的回调URL,并携带授权码(code)。在回调URL,将获取到的code参数传递给登录接口进行处理。 以上是一个简单的实现钉钉第三方登录的步骤,你可以根据自己的需求进行适当的调整和扩展。注意保护敏感信息,如AppKey和AppSecret,不要直接暴露在代码或公开可见的地方。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值