AutoGluon

最新推荐文章于 2024-08-09 07:54:13 发布

飞锡2024

最新推荐文章于 2024-08-09 07:54:13 发布

阅读量1.8k

点赞数

文章标签：推荐标签医药

本文链接：https://blog.csdn.net/weixin_38235865/article/details/121408729

版权

参考：AutoGluon背后的技术
 10行代码战胜90%数据科学家

自动对数据抽取特征并进行模型训练，

大部分automl框架是基于超参数搜索计算，Autogluon依赖于融合多个无需超参数搜索的模型

融合计算
stacking在同一个训练集训练出多个模型，这些模型输出进入线性模型对输出做加权和做最终输出

k则交叉bagging
训练同一个模型,使用不同的初始权重或者数据块，模型输出取平均降低方差

多层stacking
将模型输出跟数据合并起来，再做stacking,训练多个模型，再用线性模型得到输出

与其他模型比较
在这里插入图片描述

在这里插入图片描述
实践

from autogluon.tabular import TabularDataset, TabularPredictor
import pandas as pd
import numpy as np
from sklearn.metrics import explained_variance_score, mean_absolute_error, mean_squared_error, r2_score

train_data = TabularDataset('train.csv')
id, label = 'id', 'activity_avg_day_sale'
predictor = TabularPredictor(label=label).fit(
train_data.drop(columns=[id]))
test_data = TabularDataset('test.csv')
y_true=test_data[label]
y_pred = predictor.predict(test_data.drop(columns=[id, label] ))

submission = pd.concat([test_data ,pd.DataFrame({'predict_activity_avg_day_sale':y_pred})],axis=1)
submission.loc[submission['predict_activity_avg_day_sale']<1,'predict_activity_avg_day_sale'] = 1
y_pred = submission['predict_activity_avg_day_sale']
submission.to_csv('test_result.csv', index=False)
print('rmse:', np.sqrt(mean_squared_error(y_true, y_pred)))  # 计算均方差根判断效果
print('r2:', r2_score(y_true, y_pred))  # 计算均方误差回归损失，越接近于1拟合效果越好
print('平均绝对值误差：',
          mean_absolute_error(y_true, y_pred))  # 为每个数据点计算残差，取所有这些残差的平均值
print('可解释性方差', explained_variance_score(y_true, y_pred))
print('平均准确度误差：', np.mean(abs(y_true - y_pred) / y_true))

加载模型

 predictor = TabularPredictor.load("AutogluonModels/ag-20211120_071953/")

飞锡2024

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫