参加比赛的小伙伴肯定知道在哪提交结果了,但是提交的格式或数据有可能会出现一些小问题,下面介绍一下我的方法,亲测有效哦!
大赛官网对提交结果的要求如下图所示:(注意事项)
- 带标题行
- 编码格式
- 数据记录总数固定
- 模拟提交结果:
import numpy as np
#生成测试数据集中的 user_id,共100万条记录
user_id = np.arange(3000001,4000001,1)
#array([3000001, 3000002, 3000003, ..., 3999998, 3999999, 4000000])
#生成年龄预测结果
predicted_age = np.full(1000000,3)
#array([3, 3, 3, ..., 3, 3, 3])
#生成性别预测结果
predicted_gender = np.full(1000000,1)
#array([1, 1, 1, ..., 1, 1, 1])
#将三个数组合并
data = np.column_stack((user_id,predicted_age))
data = np.column_stack((data,predicted_gender))
#array([[3000001, 3, 1],
# [3000002, 3, 1],
# [3000003, 3, 1],
# ...,
# [3999998, 3, 1],
# [3999999, 3, 1],
# [4000000, 3, 1]])
import pandas as pd
#将生成的结果转换为DataFrame类型,带标题行
subdata = pd.DataFrame(data,columns=['user_id','predicted_age','predicted_gender'])
#写入submission.csv文件中,编码格式为无 BOM 的 UTF-8
subdata.to_csv('submission.csv',encoding='utf-8-sig')
- 将submission.csv文件放入自己的COS存储桶,使用该存储对象的存储路径在大赛官网进行结果提交