天池-优惠卷预测大赛-模型预测

最新推荐文章于 2023-10-08 13:37:17 发布

予亭

最新推荐文章于 2023-10-08 13:37:17 发布

阅读量591

点赞数

分类专栏：学术文章标签： XGBoost 模型预测

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/randompeople/article/details/82051731

版权

学术专栏收录该内容

44 篇文章 3 订阅

订阅专栏

预测

前一文中，我们得到了训练的XGBoost模型，现在利用这个模型来预测测试集

1、引包

import pandas  as pd
import numpy as np
import xgboost
import matplotlib.pyplot as plt
import time
import os
import sys
import json
import operator

2、文件路径

# raw field name
user_label = 'User_id'
coupon_label = 'Coupon_id'
date_received_label = 'Date_received'
probability_consumed_label = 'Probability'

3、预测

# 加载模型
model_file_path='D:/workspace/gitWorkSpace/O2O-Coupon-Usage-Forecast-master/O2O-Coupon-Usage-Forecast-master/code/wepon/data1/model/trainModel_2018081901PM40.model'
model = xgboost.Booster(model_file=model_file_path)

# 加载测试集
fileDir='D:/workspace/gitWorkSpace/O2O-Coupon-Usage-Forecast-master/O2O-Coupon-Usage-Forecast-master/code/wepon/data1/'
predict_path=fileDir+'data/dataset3.csv'
predict_features = pd.read_csv(predict_path).astype(float)
predict_matrix = xgboost.DMatrix(predict_features.values, feature_names=predict_features.columns)


# 预测模型
labels = model.predict(predict_matrix)
frame = pd.Series(labels, index=predict_features.index)
frame.name = probability_consumed_label

plt.figure()
frame.hist(figsize=(10, 8))
plt.title('results histogram')
plt.xlabel('predict probability')
plt.gcf().savefig('{0}_{1}{2}'.format(fileDir+"/predit",'1111123', '.jpg'))
plt.close()
# 将预测标签和数据集合在一起
data_split_path= 'D:/workspace/gitWorkSpace/O2O-Coupon-Usage-Forecast-master/O2O-Coupon-Usage-Forecast-master/code/charles/data_split'

submission = pd.read_csv(data_split_path+"/predict_data/dataset.csv")
submission = submission[[user_label, coupon_label, date_received_label]].join(frame)  # 把核销概率拼接在一起
submission.to_csv('{0}_{1}{2}'.format(fileDir+"/predit",'123', '.txt'), index=False)