点击上方,选择星标,每天给你送干货!
炼丹笔记闲谈
作者:时晴,炼丹笔记小仙女
在互联网行业从事算法相关工作有一段时间了,经常被问到作为一名女算法工程师是一种怎样的体验,最近也在知乎上看到了类似的问题,于是乎我决定写一下作为程序名媛的日常。
校园里的日常
在学校时,除了每天宅在实验室,其实周末的我是这样的!????
但是毕业时,每天重复着读论文—>写论文—>改论文—>改论文—>改论文... (大概也就是"最终版.doc"慢慢变成“最终最终绝不修改版v99.doc”)而已,然后我就变成了这样!????
工作时的日常
从学校毕业之后,工作的日常节奏就变得紧凑了许多。先说下日常节奏吧,每天大概9点半到公司,到公司的第一件事情,就是查看一遍自己的线上作业是否正常,如果有作业挂掉、或者数据不正确的话,那...debug的一天开始了....运气好的重启一下,一上午就过去了....运气不好的话,一天就过去了
ok,如果没有异常,那就查看一下邮件,接着写写今天的机会,有时也读读论文、开开早会。
中午午休的时候,我经常会找个安静的地方,发发呆...然后下午两点就开始一天的coding....
晚上的话,根据自己的工作排期进度,日常会在9点左右下班吧。最近看到了PDD姑娘的事情......让我开始了懂得了惜命....跑题了 跑题了....
算法的平时工作是什么?
算法的平时工作是什么?其实很多还没踏入这个行业,或者想要踏入这个行业的小白是挺好奇算法工程师每天都在做什么的。那就拿我为例吧,我的一名推荐算法方向的程序媛,平时大部分时间都花在了,业务理解、开会沟通、数据清洗、特征工程、构建模型、Badcase分析等。
首先,个人习惯是做事情之前要理解自己在做一件什么事情,很多业务背景上的限制,会决定后续整个算法建模的方向或者优化方向,所以做好提前的沟通是必不可少的!
其次,整体思路和架构有了之后,数据上的麻烦事情就来了,和数据竞赛中的数据集不一样,生产环境的数据可谓是“脏乱差”,数据埋点的不规范、采集系统的bug、业务系统的问题、数据作业的延迟等等都会给训练样本的生产带来极大数据清洗难度。让我从一个淑女变得经常想说 F 开头的那个word....
然后,模型构造完成之后,大部分时间是在debug问题,和线上的badcase进行分析,尝试去理解模型是在什么情况下产生的badcase,又该怎么去修复它。
最后,又回到了每天检查和监控稳定的轮回里....
算法平时都在用什么?
下面这张图是 炼丹笔记 社群里一位群友发的图,我看了一下,和我平时使用的的差不多,在这里分享给大家。
SQL:离线数据、实时数据的提数工具,没这个基本什么都做不了...
Spark:一些离线数据的复杂逻辑处理,需要他来处理。
TensorFlow:不用介绍来吧,codeing的主要框架,当然还有Pytorch。
Docker:线上模型部署,模型服务的载体,dockerfile了解一下呀~
Pandas:接口和函数特别多,遇到问题百度一下,比自己重写好得多的~
....
程序媛的周末
工作后,变得和学生时代不同了,不会想着去逛街了!
周末的早上偶尔偷个懒,早上10点起床,然后开始了自己“持续学习”的一天!
在人工智能算法这个领域,技术迭代是非常快的,你在学校学到的,其实是学习的能力,而不是某行代码怎么写,所以不断的跟随前沿和掌握新的技术,是很重要的。不要老想着摸鱼,虽然摸鱼一时爽,一直摸鱼一直爽...我见过好多算法工程师的混子,他们的一天用两个字就可以概况了....
哎呀~不早了,今天休息休息,洗洗睡了~大家晚安~
说个正事哈
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“深度学习自然语言处理”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
推荐两个专辑给大家:
专辑 | 李宏毅人类语言处理2020笔记
整理不易,还望给个在看!