第一模块:数据分析基础篇16讲
01 数据分析全景图及修炼指南
数据分析主要有哪几个重要组成部分?
- 数据采集。它是我们的原材料,也是最**“接地气“**的部分,因为任何分析都需要有数据源。
- 哪些常用数据源
- 开源数据源
- 爬虫获取
- 日志采集
- 传感器等
- 数据采集工具
- 八爪鱼
- Python爬虫
- 搜集客等
- 哪些常用数据源
- 数据挖掘。它是最”高大上“的部分,也是整个商业价值所在。之所以需要进行数据分析,就是想要找出数据之中所隐藏的规律,从而帮助指导业务。So,数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能BI。
- 基本流程
- 十大算法
- 数学基础
- 数据可视化。它是数据领域中万金油的技能,可以帮助我们直观地了解数据分析后得出的结果。
- 如何进行可视化呢?
- 第一种是使用Python。可以利用Matplotlib、Seaborn等第三方库实现。
- 第二种是使用第三方工具。如微图、DataV、Data GIF Maker等第三方工具。
- 如何进行可视化呢?
在做数据分析项目时,若已经思考好了数据挖掘的算法模型,应牢记两点原则。
- 1.不重复造轮子
- 一个模型是否有相关的类库可以使用,因为它可以帮助我们更快、更好的实现我们的目的。
- 2.工具决定效率
- 优先选择使用者最多的工具,因为它bug少、文档全、案例多。
陈旸老师提出的一些学习上的建议:
- 记录下你每天的认知。即学习到了哪些知识点,对知识点的掌握程度怎样。
- 这些认知对应工具的哪些操作。用工具来验证你对知识点的掌握,并用自己的语言记录下这些笔记
- 做更多练习来巩固你的认知。多做练习、多做练习、多做练习(重要事说三遍,这个是我说的)