大赛地址: https://college.upaas.unionpay.com/upgeek-web/user/login
第一次参加这样的竞赛,用xgboost写的baseline先占坑后续再写。
赛题
本次大赛基于脱敏和采样后的约 40,000 条用户消费行为数据,预测在未来的一段时间内,用户对于某产品是否会有购买和收藏的行为。
参赛团队需要设计相应的算法进行数据分析和处理,比赛结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。
code
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import log_loss
import numpy as np
import xgboost as xgb
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import cross_val_predict
import lightgbm as lgb
import warnings
warnings.filterwarnings('ignore')
import matplotlib.pyplot as plt
# 加载数据
def load_csv():
train = pd.read_csv('/home/kesci/input/round11379/train_round_1.csv')
test = pd.read_csv('/home/kesc