12.其他数据科学任务和技巧
基本概念:我们的作为许多共同数据科学技巧基础的概念;熟悉数据科学基础版块的重要性
主要技巧:关联和共发;行为画像;关联预测;数据约简;潜在信息挖掘;电影推荐;误差的偏差-方差解构;模型融合;从数据中进行因果推理
共发和关联:找到互联的项
衡量惊喜:提升和杠杆
例子:啤酒和彩票
脸书喜欢之间的关联
画像:找到典型行为
关联预测和社交推荐
数据约简,潜在信息,和电影推荐
偏差,方差和模型融合
数据驱动因果解释和一个病毒营销案例
总结
第十二章 其它数据科学任务和技术
基本概念: 我们的基本概念是许多常见数据科学技术的基础; 熟悉数据科学构建模块的重要性。
示例性技术: 关联和共现; 行为剖析; 链接预测; 数据减少; 潜在信息挖掘; 电影推荐; 误差的偏差 - 方差分解; 模特合奏; 数据的因果推理。
分析工程的重要性
业务问题本身提供了解决方案的目标和约束。数据和领域知识提供原材料。数据科学提供了将问题分解为子问题的框架,以及解决这些问题的工具和技术。
数据科学为我们提供了丰富的工具解决常见任务,分析工程就是要将问题解构成可以解决的问题。