目录
关于数据分析的学习,其实老DC建议使用Python。相比于其他的数据分析工具,Python学起来简单,用途非常广泛。 那么怎么学Python来做数据分析呢?
关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类:
一类是提供各种资源的推荐,比如书单、教程、以及学习的先后顺序;
另一类是提供具体的学习内容,知识点或实际案例。
学习最有用的那部分知识,才能避免无效信息降低学习效率。
对于数据分析这件事情,有很多的应用场景:
- 比如你需要进行调研,来了解市场的宏观情况,窥探竞争对手,做可行性分析……
- 比如你所在的工作部门产生了大量的数据,你需要考虑用这些数据来优化产品、营销、技术方案……
- 比如你需要对产品、业务、用户进行分析,挖掘出重要结论,给上级提出合理的决策建议……
通过这些常见的数据分析场景,你就可以获得数据分析项目的基本流程。
一般大致可以按“数据获取-数据存储与提取-数据预处理-数据建模与分析-数据报告”这样的步骤来实施一个数据分析项目。
按照这个流程,每个部分需要掌握的细分知识点如下:
1、 如何获取数据
我们分析的数据一般有内部数据和外部数据两种。
内部数据是在我们的业务运转中产生,比如常见的用户数据、产品数据、销售数据、内容数据等等。内部的数据相对来说更加完善、规整,我们经常要做的工作汇报、产品优化等分析数据一般来源于此。可以找公司的技术人员索要,或者自己去数据库提取。
当然,很多时候,我们需要利用外部的数据。比如进行市场调研,竞品分析,或者输出报告的时候,外部数据的分析是必不可少的,这也可以帮助我们得出更多的结论。
外部数据的来源通常有三种方式:公开数据源、网络爬虫爬取、其他数据获取方式
△ 常用的数据获取方式
数据来源汇总:有哪些一般人不知道的数据获取方式(收藏)
2、 数据存储与提取
数据库这个技能放在这里,是因为这是数据分析师的必备技能。大多数的企业,都会要求你有操作、管理数据库的基本技能,进行数据的提取和基本分析。
SQL作为最经典的关系型数据库语言,为海量数据的存储与管理提供可能。MongoDB则是新崛起的非关系型数据库,掌握一种即可。
初学建议SQL。你需要掌握以下技能:
1.查询/提取特定情况下的数据:企业数据库里的数据一定是巨量而繁复的,你需要提取你想要的那一部分。
比如你可以根据你的需要提取2017年所有的销售数据、提取今年销量最大的50件商品的数据、提取上海、广东地区用户的消费数据……
2.数据库的增、删、改:这些是数据库最基本的操作,但只要用简单的命令就能够实现。
3.数据的分组聚合、建立多个表之间的联系:这个部分是数据库的进阶操作,多个表之间的关联。
在你处理多维度、多个数据集的时候非常有用,这也让你可以去处理更复杂的数据。数据库听起来很可怕,但其实满足数据分析的那部分技能不要太简单。当然,还是建议你找一个数据集来实际操作一下,哪怕是最基