一文读懂数据科学工作流程

本文揭示了数据科学家的真实工作状态,包括处理数据、制作模型、沟通协调等多个方面。数据科学家不仅需要技术过硬,还需具备优秀的沟通能力。以信贷风控建模为例,详细阐述了从需求理解、数据源调查、数据清洗、特征工程、模型训练到上线运营的完整流程,强调在整个过程中与上下游的沟通至关重要。
摘要由CSDN通过智能技术生成

点击关注“数据科学应用研院”
领取干货资料

在大数据和人工智能异常火爆的当下,数据科学家已成为一个炙手可热的岗位,成功从众多码农标签中脱颖而出,站上鄙视链顶端。

数据科学工作:你以为的 VS 实际上的

在很多人眼里,数据科学家的工作似乎光鲜亮丽,充满技术含量:

在这里插入图片描述

但实际上,数据码农的工作状态通常是这样的:

在这里插入图片描述

数据科学家的一天是这样开始的,早上到公司,先打开邮箱查看需求爸爸们的新需求和负反馈。然后打开jupyterlab做做数据校对,把问题反馈给工程开发的小伙伴,或者写写文档,插入几个美美的示意图,让需求爸爸们看完后心旷神怡。

与此同时,把还没开始跑的报表和实验都启动下,把当天要用的spark资源先占住。不出意料,报表和实验结果,90%的情况下效果不甚理想。正要找原因的时候,会议提醒闹铃响了,马不停蹄赶到会议室,给需求爸爸们把牛皮一通乱吹,吹完后一起午饭联络感情。

下午回来赶紧把吹出去的牛皮但还没做的报表和实验给恶补起来,把上午跑的实验结果仔细校对,发现一堆数据问题,然后挨个检查数据,重新计算成特征,再重新跑实验…经过九九八十一次调整后,实验效果才能显

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值