追逐冠军的少年 | 算法工程师岗毕业三年总结

本文是一位算法工程师对自己从回归计算机行业到成为冠军的三年历程的总结。作者从数据竞赛起步,经历了京东的金融场景推荐任务,通过深度学习突破自我,再到多任务推荐与技术沉淀,分享了他在工作、竞赛中的成长和感悟,以及给毕业生的建议。通过不断学习和实战,他在多个数据竞赛中取得了优异成绩,并出版了机器学习竞赛书籍。
摘要由CSDN通过智能技术生成

写在前面

从“数字中国建设峰会”回到北京的这个周末,一个人来到公司,回想这几年走过的路感慨良多。于是乎提起笔,写一下我这几年的经历、感悟、收获。给自己做一个阶段性的总结,同时也记录一下我是怎么从“水暖建材行业子弟”重回“计算机行业”,又是怎么由一个“数据算法竞赛小萌新”一步步成长,并取得一些成绩的。

那么,先做一个自我介绍,大家好,我是 DOTA,我是 朱翔宇。


2015:回归 | 回归学校
2017:起始 | 开始于这个夏天
2018:入世 | 加入京东的第一年
2019:突破 | 突破自我 拥抱变化
2020:挑战 | 当打之年 一往无前


v2-0045c2d99aa34bfe321cc136926c6c32_b.jpg


2015:回归 | 回归学校,重回计算机行业

2015年对我来说是一个特殊的年份。
这一年,我父亲去世了。
这一年,我放弃了父亲留下的公司和水暖建材生意。
这一年,我在本科毕业两年之后,选择了重回学校。
正如《平凡之路》中朴树唱的一样,我曾经拥有着的一切,转眼都飘散如烟。但人生本就如此,我们总归会遇到一些自己不愿面对的事情,这也正是成长的意义。

v2-0c79e40c375f9e532c667d7ccf7b82d0_b.jpg


在北科大读研期间,有着明确目标和想要什么的我,从研一泡在图书馆到研二常驻实验室,抛弃了所谓的生活与社交,并且最后毕业典礼我也没去参加。在那时的我看来,我需要是的时间去弥补曾经的空白,需要的是提升我对领域的全面认知,需要的是用忙碌来让自己少胡思乱想。整个过程看起来很极端,但是对空白状态的我来说,却是极其有效的。

同时幸运的是我遇到了一个好导师,在阳小龙教授那里我学会了3件终身受益的事情,一是,通过对文章一次次反复的修改、批注、修改、在批注的过程中,我看到了自己逻辑上所存在的问题,并逐渐形成了对全局和对细节的把控能力;二是,相较于放养模式,从进入实验室的那一刻,每周分享、总结、陈述的周会,养成了良好的自学和表达能力。在一种只有阶段性目标,没有细节控制的实验室氛围下,有了更多思考思辨的时间,也让完成目标的方式有了无数种可能。“只定目标,不做计划” 这一点也成了我沿用至今的前进方式;三是,我曾经有个阶段是负能力爆棚的人,对看不惯的人和事,时常有负能力的表达,但正如后来阳老师提醒我的那样,一个连自己情绪都控制不了的人,又能在未来走多远呢?

2017:起始 | 开始于这个夏天


2017年的夏天,偶然的机会我接触到了数据竞赛,本科阶段参加大学生数学建模竞赛的我,对这种新的数据竞赛形式充满了好奇,于是,在一种好奇与自信的情绪下,我参加了2017年的“中国高校计算机大赛——大数据挑战赛”。

v2-3557114a3ccc12a61d85f89921652bdb_b.jpg


赛题描述:鼠标轨迹识别当前广泛运用于多种人机验证产品中,不仅便于用户的理解记忆,而且极大增加了暴力破解难度。但攻击者可通过黑产工具产生类人轨迹批量操作以绕过检测,并在对抗过程中不断升级其伪造数据以持续绕过同样升级的检测技术。我们期望用机器学习算法来提高人机验证中各种机器行为的检出率,其中包括对抗过程中出现的新的攻击手段的检测。

数据层面,给出了鼠标移动轨迹(x,y,t),目标坐标(x,y)和类别标签:1-正常轨迹,0-机器轨迹。通过建模预测某条轨迹属于正常轨迹还是机器轨迹。

2017年的我,在算法模型层面还是个小白,虽然经过两年的积累有了不少基础,但是在真正的实际问题面前,你会发现之前学习到的东西有多理想化。不过有一点我还是清楚的,特征决定模型的上限,而算法模型在无限的逼近这个上限。因此,我开始自己的特征工程之路,由原始数据(x,y,t)数据对x-y、x-t、y-t进行可视化分析。同时我的特征设计理念是:特征描述“人”,而非用特征描述“机器”,寻二者之异,以达泛化目的。突出XYT各自特征细节及有效的利用组合特征,特征提取时分别将X、Y、T进行归一化处理;同时,结合规则由横向特征(X),纵向特征(Y),时间特征(T)三个角度提取特征。

模型层面只选择了单模XGBoost模型,在没有做交叉验证的情况,拿到了决赛全国第6名的成绩,可见在特征构建和对问题的理解层面,做的还是可以的。如果你要问我为啥不做CV,不做融合呢?那我只能告诉你,因为我无知呀,那时的我还是个小白。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值