输入数据:
在train/目录下包含一个train.csv文件,其中每行表示数据的一条记录。文件中每行共有18列,列income为收入分类(0表示小于等于50k,1表示大于50k)。其余各列为数据对象的各项参数特征(连续属性:age、fnlwgt、education-num、capital-gain;workclass、capital-loss、hours-per-week;离散属性:education、marital-status、occupation、relationship、race、sex、native-country)。训练数据集可在教学资料中下载,微文件名:xgboost-train.csv。
在test/目录下包含一个test.csv文件,与train.csv类似,只不过test.csv不包含income列,您需要根据参数给出预测。
输出数据:
您的程序需要生成一个result.csv文件,用于保存您程序的预测结果。第一行固定为income,之后每一行为一个1或0的值表示预测结果。
评价指标:
准确率。
输入样例:
age,workplace,id,education,education_num,marital_status,occupation,relationship,race,sex,capital_gain,capital_loss,hours_per_week,native_country,income
39, State-gov,77516, Bachelors,13, Never-married, Adm-clerical, N