1任务
- 给定数据集,数据三七分,随机种子2018。(在任务1中什么都不用考虑,即不需数据处理和模型调参)
调用sklearn的包,简单构建逻辑回归、SVM和决策树3个模型,评分方式任意(e.g. 准确度和auc值)。
2基本要点
- csv是常用的数据存储格式,尤其是一些数据竞赛,pandas可以方便的读写csv文件
data_all = pd.read_csv('./data_all.csv')
data_all.to_csv('./submission.csv', index=False)
- sklearn中各种算法的调用方法都是差不多的,基本上有以下四个函数:
model = ..() # 初始化,不同算法初始化的参数不同
model.fit(X,y) <