一、课程总结
二、多角度数据分析
除了以上介绍的思路以外,其实我们还可以从多个角度进行数据分析的解读。
1.从目的角度来看
描述性任务:直接获取能代表数据特征的指标,我们需要了解的就是这些指标。
断因类任务: 常结合目的来看。如:分析你的男朋友为什么不理你或生气了,我们就需要获取他生气前后的行为特征和环境特征进行分析,得到和生气相关性最大的特征。
预测类任务:根据已有的数据特征,总结归纳出规律对未来未知的情况和未出现的数据做预测。
决策类任务:面对选择,我们要做决策,就需要整合已有的数据特征和规律。尤其是与收益相关的指标,以做出个更加明智的决定和选择。
2.从过程论方面进行解读
也就是本门课讲的流程,具体可根据业务需要来选择。
3.以方法论角度进行数据分析
每种方法解决一种类型的问题。可以把数据分析看成是个工具包,需要解决什么问题就拿出什么工具。
三、大数据
大数据分析思路、思想与本门课分析方法大致一样,不过使用的工具不同(用集群的思想处理)。
对比单机python和大数据分析python的spark接口: