比赛数据的下载
前往阿里云比赛官网,下载所需要的比赛数据比赛官网,包括一个训练集,一个验证集,一个测试集。
比赛数据的研究
该数据通过数字加密,因此全是数字组成。
在数据集中标签的对应的关系如下:{‘科技’: 0, ‘股票’: 1, ‘体育’: 2, ‘娱乐’: 3, ‘时政’: 4, ‘社会’: 5, ‘教育’: 6, ‘财经’: 7, ‘家居’: 8, ‘游戏’: 9, ‘房产’: 10, ‘时尚’: 11, ‘彩票’: 12, ‘星座’: 13}。
数据的评价标准为f1_score,该值越大,说明预测越准确。
比赛思路
对于该数据集,我们首先应该使用panda模块进行分析,分析数据的构成形式,后续在利用进行分析。