1.为什么需要数据分析
大数据时代,越来越多数据产生,通过分析数据规律,可以构建用户画像等,是时代的“淘金”。如果说互联网上半场是粗狂运营,因为有流量红利不需要考虑细节。那么在下半场,精细化运营将是长久的主题。有数据,有数据分析能力才能让用户得到更好的体验。
2.数据分析 = 数据采集+数据挖掘+数据可视化
学习数据分析最关键的部分是数据挖掘,数据挖掘就是从数据中淘金,数据挖掘的基本流程:
- 商业理解:从商业的角度理解项目需求。
- 数据理解:尝试收集部分数据,然后对数据进行探索,包括数据描述、数据质量验证等。
- 数据准备:开始收集数据,并对数据进行清洗、数据集成等操作,完成数据挖掘前的准备工作。
- 模型建立:选择算法模型,并进行优化。
- 模型评估:对模型进行评价,看是否实现商业目标。
- 上线发布:转化成用户可以使用的方式,呈现的形式可以是一份报告,也可以是实现一个比较复杂的、可重复的数据挖掘过程。数据挖掘结果如果是日常运营的一部分,那么后续的监控和维护就会变得重要。
3.数据挖掘十大算法
- 分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CART
- 聚类算法:K-Means,EM
- 关联分析:Apriori
- 连接分析:PageRank
4.学习数据挖掘的最佳路径
像学车考驾照一样,先学习基本的知识,再开车上路,所以我们可以采取知识清单的方式进行学习,如学习数据挖掘十大算法,各个击破。高效的学习方法,把它称为MAS 方法。
- Multi-Dimension:想要掌握一个事物,就要从多个角度去认识它。
- Ask:不懂就问,程序员大多都很羞涩,突破这一点,不懂就问最重要。
- Sharing:最好的学习就是分享。用自己的语言讲出来,是对知识的进一步梳理