目录
1.数据项目思维
(1)数据项目要素
-
项目计划、实施方案、前期文件
-
七大要素:需求(做什么)、目的(做成什么样子)、定义(各数据字段或指标的定义)、数据源、逻辑、思路、方案
- 交付物、交付时限、交付物验收标准(项目完成的定义)
(2)数据项目workflow
-
项目实施前:积极沟通,明确与落实项目各要素,注意:项目计划要为“返工修补”预留时间;实施方案起点不要定太高、要能切实落地
-
项目实施中:把握好实施方向与步骤,对于需求方更改需求或添加要求,能拒绝则拒绝,不能则要讨价还价般争取些资源(如时间)
-
完成交付物:必须认真检查结果数据、核对交付物是满足验收标准
-
项目结束后:整理项目文件并归档,进行复盘 或 思考总结,思考优化方案(省力省时结据更优)
(3)数据项目易犯错误
-
对每次交流商榷后的内容,要存档留据,必须发邮件互相转告落实
- 不要让随意更改需求而打乱节奏、不要把战线拉得过长而超出计划、不要把口子拉得过大而收不住、不要把实施方案定太高而难落地
- 所谓的“完成”,并不是你交付出交付物那一刻,而是需求方收到后、检查后,点头说ok 那一刻
(4)衡量数据项目一些方法
-
项目重要性衡量:使用对象、服务的业务的重要性、存在增值项
-
项目难度衡量:实施内容涉及因素、对象的范围、资源到位情况、变量因素多少
-
项目成果衡量:数据项目往往是辅助项目,不像游戏项目那样能直接以钱论成果多少,所以做项目前应考虑项目成果的衡量难度,就像投资前考虑收益多少一样
(5)项目各阶段处理方式
-
统筹规划阶段:注重整体大局、全面思考、明确目标、理清思路、确立计划
-
实施执行阶段:分优先级、选好切入点、hold住前进方向、控制好节奏
-
处理问题阶段:及时抛出问题、不逃避问题
-
事后总结阶段:事后复盘、总结思考 (这让人进步得快)
2.数据项目要点
- (1)严守两大关口-输入与输出:检查接手过来的数据与文件,数据被delivery出去前也要多角度检查,总之eat your dog food
- (2)弄懂后才做、不懂不做:不懂,做了往往做错,浪费时间,不如不做;弄懂内容包括需求、目的、定义 ,这3方面往往是需求方提供,也包括数据源、逻辑、思路、方案,这4方面是执行者考虑的,所以实施之前需要弄清这七大要素
- (3)宁可断、不可乱:断是指停止、甚至舍弃,乱是指思路不清、取舍不定;造成乱的原因往往是七大要素不明确 或 没有统一规范准则而模棱两可、取舍不定;当乱时,就得停止下来,明确6大要素,确定统一规范,记住一点:没有完美的方案,权衡利弊取最优者
3.经验之谈
(1)易犯错迹象
-
含糊不清:数据项目七大要素不明确
-
模棱两可、取舍不定:没有统一规范或准则、为"完美"而死钻牛角尖
-
快而错漏百出:写代码不求快,求准,跑之前更要梳对一遍,越是重要、越是最后、越要慢
-
脑昏力乏继续死撑:这时往往是做得多错得多,须停止下来休息
- 心烦意乱、坐立不安:先调理情绪冷静下来
(2)易犯错点
-
写代码时,快速复制粘贴,忽略修改细节点
-
跑代码前不检查一遍
(3)这样的内容是记不住的
-
只是copy别人的知识内容,我是记不住的 -> 只过经过自己大脑过滤、并与自身结合或重组后,才能记住
- 内容不分层次化、或没记忆路线图,也是很快遗忘 -> 最好画思维导图、内容不多的话分组分点记忆也可
4.测试环境重要性
(1)表修改
- 只要修改表(包括增减字段、改表名字段名、改字段类型),都要考虑上下游是否修改,上游为入库脚本,下游为中间表、应用层\
- 修改表正确做法:在test库复制空表(索引约束也要一样),按要求修改空表,从正表insert更新后的数据,最后调换两表
(2)表设计
- 规范一致性、可扩展性
(3)项目开发
- 测试环境意识:涉及改表的项目必先在测试环境中进行,并且要修改涉及的中间表、报表、应用等脚本,最后才在生产环境修改
- daily update script 与 补充历史数据 : 先开发daily update script ,再一次性补充历史数据