【水比赛】中国高校计算机大赛
环境:win7,anaconda+python3.5
暑假第一次做了数据比赛,比赛地址:中国高校计算机大赛
总结一下我第一次数据比赛的经验(主要是失败的经验)
-【赛题描述】-
鼠标轨迹识别当前广泛运用于多种人机验证产品中,不仅便于用户的理解记忆,而且极大增加了暴力破解难度。但攻击者可通过黑产工具产生类人轨迹批量操作以绕过检测,并在对抗过程中不断升级其伪造数据以持续绕过同样升级的检测技术。我们期望用机器学习算法来提高人机验证中各种机器行为的检出率,其中包括对抗过程中出现的新的攻击手段的检测。
本题目数据来源于某人机验证产品采集的鼠标轨迹,经过脱敏处理,数据分为3部分(数据量分别为3000条,10万,200万)。
【训练数据】
训练数据表名称:dsjtzs_txfz_training
字段 | 类型 | 解释 |
---|---|---|
a1 | bigint | 编号id |
a2 | string | 鼠标移动轨迹(x,y,t) |
a3 | string | 目标坐标(x,y) |
label |