Python数据分析入门

Python数据分析基础入门系列已经粗略过完一遍,我是跟着张俊红的《对比Excel学习数据分析》这本书学习的。总体来说感觉难度不大,比较适合入门学习。

1.数据分析是运用合理的工具,在统计学理论的支持下,对数据进行一定的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获取持续竞争的优势。
2.数据分析的重点在于分析,而不在工具。我的理解是,Python是一种分析的工具,如果作为数据分析师,我们的重点在于要通过数据分析,看到数据底层的本质,看到数据反映的问题,并作出合理的优化建议,或帮助领导人作出重要决策。
3.数据分析的常规流程:熟悉工具-明确目的-获取数据-熟悉数据-处理数据-分析数据-得出结论-验证结论-展示结论

  • 熟悉工具:工欲善其事必先利其器,只有熟悉使用工具,才能更好的处理数据、分析数据
  • 明确目的:通过数据分析得出什么结论
  • 获取数据:数据来源
  • 熟悉数据:数据是否包含要分析的内容,能不能满足我们的需求;数据的类型
  • 处理数据:原始数据中替班会包含一些特殊数据,如异常数据、重复数据、缺失数据、测试数据等,要对这些数据进行预处理
  • 分析数据:通过一些列分析方法,发现问题并找到问题产生的原因
  • 得出结论:结合业务和分析数据,得出结论
  • 验证结论:数据分析得出的结论不一定成立,要结合实际业务来验证
  • 展示结论:用更加直观、清晰的形式把验证后的结论展示给相关人员,就要用到数据可视化

书中很有趣的把数据分析的整个流程比喻成炒菜做饭的原理:
“都是将一堆原材料整理分配成不同的成品:首先要了解锅(Python 基础知识);然后要买米、菜等原材料(获取数据源);菜买回来了,需要淘米洗菜(数据预处理);菜品洗好后是放在一起的,这个时候你要做什么菜,就把什么菜挑出来(数据筛选);菜挑出来以后就可以进行切配了(数值操作);菜都切好了,就可以下锅烹调了(数据运算);不同菜品需要烹调的时间是不一样的,你需要有一个炒菜计时器(时间序列);菜全部做好了,凉菜和热菜肯定是不能放一起的,需要分开放(数据分组);除了常规菜,还可以做一个水果拼盘(多表拼接);所有的都做好了,就可以端上桌了(结果导出)。菜全部做好后,第一件事情是什么?是拍照发朋友圈,发朋友圈肯定要把菜品摆一摆,然后打开相机的美颜、滤镜拍照,照片拍完了,发朋友圈,这一过程就是数据可视化的过程。”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值