数据分析(一)基本模型与概念
基本模型
在本系列中所谈及的数据分析主要是指比较基础常见的技术操作,以及与文本挖掘、自然语言处理等的交叉部分;能力延伸部分是本人近日在准备春招过程中,参照不同企业的招聘需求和笔试题列举出的部分考查点。疏漏之处请各位大佬指出。
另外无意中看到 一篇腾讯的文章 ,很好地梳理了与数据分析相关的概念,建议沉下心来阅读。
这系列的第一篇是作为字典使用的,总结本系列中出现的基础模型和主要概念。既方便新手从全局去学习这个系列,也方便老司机对照下可能需要补充的能力。
暂时就想到这些,有时看到新的东西会不定期更新。
之前在知乎发过 另一篇 ,可以相互对照参考下。
数据分析模型
- (BTW,数据分析师的基本素质之一:异动指标分析,深度的专题分析,提炼数据产品需求)
- 业务调研
- 准备数据
2.1 数据抽样
2.2 数据过滤
2.3 数据预处理 - 浏览数据
3.1 可视化
3.2 聚类
3.3 关联分析 - 变量选择
4.1 特征工程