(相关学习链接已隐藏,直接点击即可)
1.技术
相关论文Hidden Technical Debt in Machine Learning Systems
1.数据获取
ETL(Extract, Transform, Load)是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,ETL工具的典型代表有:Informatica、Datastage、OWB、微软DTS等
2.构建特征
spark, hadoop, flink等分布式计算平台(大数据机器学习和数据挖掘的并行化算法研究)
3.可视化数据
python: matplot, seaborn
excel数据可视化(书籍:Use Excel:数据可视化指南)
4.使用服务器
5.UI层面 可以略过
-----------其余时间和客户或者产品经理沟通,然后理解业务,做ppt,汇报结果
2.业务
了解业务痛点、流程
了解真正需求、制约因素(落地能力)
3.软实力
沟通,思维