数据分析的五个步骤
最近几周在苦攻Udacity的数据分析(入门)课程,其中介绍了数据分析过程的五个步骤。结合后面案例展开中我的一些思考和总结,分享给大家~
1. Question 提出问题
有时你可能先获取一批数据,然后根据它来提问;或者你也可能先提出问题,然后根据问题来收集数据。无论哪种情况,好的问题可以帮助你将精力集中在与解决问题相关的数据上,并帮助你得出有价值的见解和分析。
—— Think about “What problems are you trying to solve?” “What questions should you ask to solve the problem?” Good questions will lead to valuable results.
对数据集提问的常见思路:
- 最高/最多 - 这些最受欢迎/最热门/最高频率的选项,拥有哪些共同的特点?
- 最少/最低 - 可能正是要解决的痛点和短板!
- 比如:如果希望整个星期的单车租用数量呈平稳状态,共享单车公司应该在一周的哪一天开展促销活动?
- 趋势/模式 - 随着时间发展的趋势或者模式;可以是横向(广度)或者纵向(深度)的趋势比较
- 对比 - 没有对比就没有分析
- 比如:哪支球队在这段时间表现的其它球队更好?