一、什么是数据分析
观测、实验、应用
二、重新认识数据分析
观测:对事物形式客观量化的认知(报表、图表、仪盘表)
实验:发现规律、验证假设(A/B实验)
应用:不断基于数据反馈迭代产品
三、观测
观察:采集数据、储存数据、展示数据
——————————————————————————————————
——————————————————
——采集数据:解析系统日志
——采集数据:埋点获取新数据
——采集数据:通过传感器采集
——采集数据:爬虫(解析网站)
——采集数据:API(API文档平台、用API获取数据)
——储存数据:各种类型的数据库:hive、MySQL、presto、impala(数据工程师)
——储存数据:连接数据库取数
——展示数据:可视化高效传达信息
测量:设定标准、发现异常、研究关系
——————————————————————————————————
——————————————————
分析数据的目的是什么?
——及时发现异常
——找到数据之间的因果关系
数据是客观统一的:有统一的认知才能有共同的目标
——设定标准+发现异常
——研究关系:可视化查看相关性、建模推导相关性
四、实验
——————————————————————————————————
——————————————————
——提出假设,验证假设
——观测到差评率飙升、假设由恶劣天气引起、通过天气数据验证假设
所有未经过事实数据验证的想法都是假设
设计A/B测试获取数据
——实验目标、实验假设、实验打分、实验指标、实验观众、实验版本、开发验收、实验结果、实验分析、后续计划
五、应用-如何应用数据创造价值
——基于数据反馈不断迭代产品和业务策略,明确业务的目标,拆解目标,得到标准值
——流程拆解法、二分法、象限拆解法、杜邦分析法、AARRR、pest、rfm、swot、5w1h(拆解只要符合mece法则即可)
——将数据应用于业务
——将数据应用于算法
①为算法设定明确的业务目标
②为算法提供高质量的数据
③判断算法是否真的创造了实际价值
④帮助业务更好地使用算法
基于数据和算法的竞争,无时无刻不在互联网行业上演;基于数据训练算法,让机器自动化地完成工作
六、其他
概念:UV、PV、GMV
——————————————————————————————————
——————————————————
——UV,Unique visitor,去重访问人数
——PV,Page view,包含累计的访问人数
——GMV(商品交易总额)