2019,算法工程师第一年

2019年度总结

Author:louwill

From:Machine Lab

     又到一年年底,不能免俗地来讲一下总结,美其名曰“年终讲”。公众号的老朋友知道我都是在每年过年前的两三天会写这么个东西,清点一下年初立的flag,然后更新一下来年的flag。这个传统在公众号是第三年,先感谢一下新老朋友们的关注和支持。

     2019年对我来说可以说是收获的一年。研究生毕业的第二年,参加工作的第三年,结婚买房转岗,每一件都是人生大事。结婚买房是为成家,转岗确定今后的方向是为立业,古人说三十而立,如今未满29岁,也算是对得起三十而立的说法。这个年终总结主要是说一下个人和公众号在2019年的一些输入和输出,谈一些感想,以及2020年的一些基本规划。

技术输入和输出

     2019年个人输入很多,输出却一般。上半年几乎都在为转岗做深度学习而准备,成功的完成了从数据分析师到深度学习算法工程师的职业跃迁,上半年的学习和输入在年中算是得到兑现。下半年专注于深度学习和计算机视觉,完整负责了两个大的项目,精读论文18篇,泛读论文50余篇,工作需要还接手了两篇SCI论文的写作与修改,对TensorFlow、Keras和PyTorch进行了更为精进性的学习,读完技术书籍4本,写完210页的《深度学习笔记》书稿,公众号技术原创文章40篇,学习了三个月的C++,重点提升了算法工程能力。

     精读论文主要集中在过去几年内计算机视觉的一些经典网络和NLP的几大流行模型的论文。泛读则比较宽泛,更多的是猎奇和长见识,大多读个摘要看一下方法和效果就略过。今年精读的18篇论文如下。

图1 精读的18篇论文

     精读论文包括cv和nlp两块,cv部分主要有图像分类的SOTA模型Efficientnet,图像分割包括Segnet、Deeplab、Refinenet、Auto-deeplab、Parsenet、Fast-SCNN、Pspnet和CRFasRNN等8篇论文,目标检测也有RetinaNet和RFBNet两篇论文。nlp的论文完全是因为书稿中有一章内容需要,主要研读了Elmo、Transformer、GPT、Bert、XLNet和ERNIE。还有一篇多标签学习算法的综述。可以看到精读论文的目标导向性,多标签和图像语义分割主要是项目需要,而nlp则是写书需要。精读一篇论文相当耗费精力,当初读的时候更多的是直接在paper上做笔记,后来读完了也懒得进行整理,以至于现在难以成体系化,这是来年读论文需要注意的。

图2 EfficientNet研读记录

     8月到现在通过项目一直在对深度学习框架进行更加深入的使用和学习,今年会持续推出三大框架的实战指南,包括一些标准套路、训练规范和Tricks总结。今年还读了4本技术书籍,分别是Python深度学习、统计学习方法第二版、深度学习框架PyTorch:入门与实践和TensorFlow实战,基本也都是跟工作相关度较大,这些书的学习输出也都会在今年的框架实战指南中体现。另外深度学习笔记一书目前也到了出版社内容审查阶段,一切顺利的话年后不久应该就可以出版面世。

图3 深度学习笔记书稿

     成家之后需要更多的时间向生活和家庭平衡,所以显而易见的是今年公众号的原创输出远不如2018年,全部原创文章只有40篇,2020年希望能在规划之下给大家奉献更多的原创内容。8-10月持续学了三个月的C++,后来写书和项目时间紧张就没有继续下去,希望年后能够把捡起来。此外,git、linux、shell和vim等开发工具使用趋于熟练,总体来说2019年的算法工程能力有了较大提升。

     单独说一下公众号推广的事情,2019年公众号发了一些广告推广,也发了和一些号主的互推,都是恰饭和增长需要,大环境不好,号主们在写文章的时候也都焦虑。关于推广,感兴趣的就看看,不感兴趣的不要理会就好,机器学习实验室的原则是只接机器学习和深度学习相关的课程和会议推广。

技术之外

     除了花大量时间进行技术学习之外,今年也尝试读更多非技术书籍、锻炼身体和重拾之前的一些爱好。11月的时候读完了之前一直不愿意读的红楼梦,真不愧四大名著之首,偶尔想起一些细节都会小有感慨。今年很大的一个成就就是利用吃饭时间和一些经典电视剧帮老婆补了很多历史知识,新年争取再帮她把地理盲区给打通。2020年计划读完50本非技术书籍,1月份刚读完俞军的产品方法论和一本深度思考,想为项目培养一些产品嗅觉。

图4 读完红楼梦的感慨

     2020年跟老婆定的flag是每个月去爬一次山,读书的时候那么爱爬山,如今需要重拾一下这个爱好。偶尔打个篮球,当然也是屈指可数。2020年加强身体锻炼。

图5 屈指可数的玩一次篮球

     心血来潮的时候也会秀一下书法。

图6 手书兰亭集序

2020年公众号规划

     技术学习回顾完,要开始立2020年的flag了,今年我给公众号的规划了五个模块的内容方向,包括统计与数据分析(统计出身,对本家有天然的感情)、机器学习、深度学习、工程开发和其他。重点在前三个模块,以机器学习和深度学习为核心模块。统计与数据分析包括统计理论剖析和数据分析案例,机器学习部分包括今年的机器学习算法推导(目前已更新到第14篇,总体进度14/25),机器学习实验、PRML带读,深度学习方向包括深度学习100问系列(目前更新到第13问,总体进度13/100),框架实战指南(TensorFlow、Keras和PyTorch),深度学习实验和深度学习可视化(新开辟的模块,深度学习与可视化结合),工程开发部分包括一些常规的开发工具和技术,其他模块则包括转载、内容推广和一些经验性的文章。具体如下图所示。

图7 公众号2020内容规划

     公众号的规划也是我个人的技术方向规划。目前公众号粉丝16k,常读用户不过3000人左右,跟圈内的一些大佬一年做到五万10万的没法比,但通过把内容做好来吸引一批领域内的读者和粉丝一直都是机器学习实验室的核心目标。

一些观点

     别轻易转算法。今日头条今年校招的对算法的劝退信相信很多人都看到过,这两年算法岗已经很饱和了,非计算机、数学、统计和控制工程相关专业的朋友,真心不建议挤破头转到算法来,现在大厂算法岗的标配一般都是211以上出身+顶会标配+硬核的代码能力,即使如此,到了校招季也都是神仙打架的局面。2020年,相较于算法岗,数据分析和一些开发岗也许是更好的选择。

图8 头条算法劝退

     时刻提升自己的工程能力。即使成功进到算法岗,排第一位的还是工程能力。企业不是学校,不是随便搭个网络跑个数据就可以划水摸鱼了。git、shell、linux、vim、docker、redis以及各种关系型数据库和后端部署框架等等,这些都是一个算法工程师的必备素质。很多算法问题,到最后本质上可能就是一个工程问题。

     关注其他领域。埋头做技术有出路吗,当然有,但大概率不是你我。所以技术人在成长过程中一定要适当的把眼光朝技术之外看一看。学习商业思维,产品思维,风控思维、培养理财投资理念、尝试项目管理和学习带团队。技术人员尤其是在年龄增长之后,不要一直把自己置身于与年轻人竞争的局面下。

     副业意识。副业刚需是今年流行的一个词,段子里说你永远不知道新来的同事做的副业比你工资高多少,且不论是不是段子,但颇有一定的道理。其实本质上也是一种风控思维,家庭收入若是仅依赖于上班工资,在这两年互联网大环境不好的情况下风险系数是相当高的。适当发展一些副业,学习树立一些投资理念,多条腿走路,相信不管发生什么情况你应对风险的能力都是极高的。当然,我这里不是说鼓励大家都去搞副业,是在把本职工作做好的情况下再尝试开拓一些副业收入。

图9 副业刚需

     由消费者向生产者思维变换。这也是跟前面的输入输出的概念相呼应,不管做什么事情都要有个输出物。产出多了,你的角色自然就向生产者转换了。消费者思维就是只做消耗,对于一个人而言,一直处于消费模式的话其实是一种价值衰减的行为,而生产者却恰恰相反,会想着如何为个人和社会创造产出和价值。消费者和生产者思维,本质上就是一种给个人做增值还是减值的理念。

     就说这么多。2019不够硬核,2020需要硬核起来,与诸位共勉。也提早祝各位新年快乐。

特别鸣谢

     2019年结识了很多优秀的号主,他们在各自的技术领域都笔耕不辍、细心耕耘,2020年机器学习实验室将会和他们进行更为紧密的合作。以下公众号排名不分先后。

往期精彩:

2019上半年,我成为了一名深度学习算法工程师

一个统计数据人的职业生涯第一年

数据分析入行半年之经验、感悟与思考

一个统计方向毕业生的2017年数据科学从业之路总结


一个算法工程师的成长之路

长按二维码.关注机器学习实验室

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值