数据分析是否要学Python?

学数据分析未必一定要学 Python。Python 只是数据分析的一个工具,两者没有必然的因果关系。

但是如果你不甘心只做一个平凡的数据分析师的话,小编强烈建议去学 Python。

首先要明白学数据分析思维和认知,以及动手能力是最重要的,如果你没有接触过或者并不了解什么是数据分析,或者是完完全全零起步的话建议暂时先不要碰 python。

Python 还没有兴起的那些年做数据分析的常用工具有 R、SPSS、Excel(难度由高到低)。由于近些年 Python 被资本市场炒的火热,就一定会有误导倾向,认为学数据分析就一定要学 Python,这个是错误。我在大学里教课也经常会有学生问我这个问题,我的回答是让他们脚踏实地学好基础,起步阶段选择一个自己觉得顺手的就可以,当觉得自己能独当一面或者提升自身的时候再来看 python。

数据分析和做料理一样?

工欲善其事,必先利其器。

搭建 Python 环境、学习 Python 语言、理解数据分析工作是入行 Python 数据分析最基本的三要素。但是还要有个最重要的前提是经验和思维。

这个过程就好比做日料,首先要有厨具,菜谱才能做出来,而最重要的是食材,毕竟巧妇难为无米之炊。

做数据分析也是一样,你要有开发环境,掌握代码的基本操作,数据分析的基本步骤才能做出来分析结果,而这最重要的就是数据。

没数据你分析个啥?

在这里插入图片描述

光会技能也是不够的,也需要基础的理论知识。如果没有基础的数据分析理论的话未来可能路会走歪大概率会成为一个码农。

数据分析流程思维 PPDAC

数据分析基本步骤

理解问题(Problem)

对于实际业务中发生的 Case 需要进行数据分析,首先要清楚问题是什么?方向一点错了后面所有的努力都是徒劳,以及判断问题是否需要进行数据分析?

一般步骤来说就是表明发现的问题,然后做出一个假设。

比如说现在有个问题银行贷款放款金额有业绩环比下降趋势是什么原因,我们就要假设和各种因素有关联去分析,比如风控规则重新制定?银行利率?政策关系?等等需要进行量化才能得到答案。

调查计划(Plan)

确定好分析目标之后就要制定分析调查计划,考虑到刚才说的一些可能影响的相关因素,例如风控规则重新制定、银行利率、政策关系等等。

其实这些就是我们后期用于数据分析的数据,基于数据的种类分成四大类:

  1. 列联表数据:最基础的就是经常看到的 Excel 表格数据,高级一点就是 MySQL、Mongodb数据仓库中的数据。这部分内容需要根据调查计划设计表单的字段信息,用于后期数据采集的填充。
  2. 文本数据:俗称自然语言处理(NLP),就是我们经常看到的文本数据信息。
  3. 视频数据:和分析有关的视频内容。
  4. 音频数据:和分析有关的视频内容。
  5. 图像数据:和分析有关的视频内容。

数据采集(Data)

确定目标数据以及采集方式(购买或者网络采集)。

数据采集的一般方式有调查问卷(推荐问卷星,上手简单),查询各种资料网站等等。这里罗列基于 Python 的 5 中数据采集获取的方式:

  1. 数据档案文件:数据文件是存储数据的文件。从广义上讲,存储在任何文件中的信息都可以称为数据。从狭义上讲,以数字或文本形式存储在数据文件中的结构化数据记录是数据。
  2. 数据库:是根据数据结构组织,存储和管理数据的仓库。数据库广泛用于
    CMS(内容管理系统),CRM(客户关系管理系统),OA(办公自动化),ERP(企业资源计划),财务系统,DSS(决策支持系统),数据仓库和数据集市,导入销售和库存管理,生产管理,仓库管理等业务运作。
  3. 使用 Python 获取数据:俗称网络爬虫通过技术手段大规模的抓取网站上的数据信息。
  4. 从 Excel,数据仓库获取数据:在实际的企业解决方案中,由于 Excel本身的应用范围和限制,它无法存储和计算过多的数据(例如数千万条数据记录),并且 Excel本身并不是为海量数据的应用而创建的。因此,Excel 可以用于日常基本数据处理,补充数据源或摘要数据,也可以用作显示数据结果的载体。此应用程序对于显示大量数值表非常有效。
  5. 从 API 获取数据:基本上从 API获取数据需要一些技术支持,当然这些数据价值也是可以的,不过也需要付出一些费用。比如万德、万方这样收费较高的数据库,用于行业研究和论文撰写还是有必要的。

数据分析(Analysis)

对于数据分析,重要的是总结数据,检查数据的趋势,并引导下一步行动。

数据分析的方法有很多种,未必专家的建议就是对的,只要能把自己分析的流程以及逻辑说明白,然后通过不同的方式,编程也好、工具也罢能得到一个清晰的结果就可以了。

比如经常用的分析方法有相关分析、聚类分析、回归分析、分类分析等等,覆盖了新手起步阶段的全部方法,毕竟太高端的作为初入行的小伙伴来说是用不上的。

考虑结论(Conclusion)

最根据分析结果得出结论,将创建一份分析报告,并根据分析结果提出将导致有价值的措施的行动。重要的是要考虑一个人可以得出的结论。

但是由于问题并不总是通过一个 PPDAC 周期来解决,因此将多次重复此 PPDAC 周期来解决问题。

这里就要掌握一个制作 PPT 的正确姿势和思路,这个是要用最少的文字以及适合的图形把分析结果展示给需要的人,这就成功了。

成长靠自己

切莫做伸手党,数据分析是一个熟练工成长过程,记得多看、多听、多记、多总结。

要记住你是数据分析师,而不是 xxxx 工程师,比的不是谁代码敲的好,而是能通过数据发现问题、分析问题、最终提出问题解决方法才是最重要的。

这个是答主数据分析师成长道路上的一点小小成绩,供参考。

Python 环境搭建

这里建议你不要耍帅买个苹果 Mac 这种,工作做到后期你发现你的笔记本配置跟不上,除非你花大价钱去换更好的。建议还是老老实实的买个国产笔记本就可以了,优先考虑散热,毕竟数据分析计算起来那个热量跟打游戏一样,优先考虑考虑散热好的笔记本。

环境搭建建议直接使用 Anacanda,许多操作系统例如 macOS 和 Linux,都预装了 Python。操作系统附带的 Python 版本称为系统 Python。系统 Python 几乎总是过时的,甚至可能不是完整的 Python 安装。所以拥有最新版本的 Python 非常重要。

你要明白你是专业的程序工程开发人员还是非专业的程序工程开发人员。因为不同角色使用的 Python 环境是不一样的。

Anaconda 图形操作系统环境安装

macOS 、Linux 系统图形界面、Ubantu 系统图形界面安装流程通用。

Jupyter Notebook 是一款开源 Web 应用程序,Jupyter 这个名字来源于它支持的核心支持的编程语言:Julia、Python 和 R。可用于创建和共享包含实时代码、方程式、可视化和文本的文档。Jupyter 附带 IPython 内核,允许使用 Python 编写程序,但目前还有 100 多个其他内核可供使用。

Python 编程基础知识

这部分内容建议不要花太多时间学习到一个完美的结果。可以在后续分析过程中写代码的时候去学习,比现在把每个语法一个一个地完善起来要好得多。这里给你列一个答主自学后整理的几个重要的知识点。

  1. 数据类型和基本用法
  2. 数值和字符串运算
  3. 条件 if 语句控制语法/条件分支
  4. 循环 for 语句和 while 语句进行迭代处理
  5. 函数的创建
  6. 变量范围处理
  7. 面向对象的理解(类、属性、方法、继承、封装、多态)
  8. 列表、元组、集合和字典的含义和用法
  9. 映射、过滤器、lambda

Python 数据分析常用库

作为数据分析师来说,常用的 Python 库其实非常有限,主要看使用者是否能够灵活使用应用到实际工作中。

  • Pandas:用于数据分析/分析的库,可以进行数据读取处理、统计显示等预处理。
  • Numpy:数值计算库,经常用于机器学习,因为它支持简单符号的高速矩阵运算。
  • PyEcharts:用于数据可视化的库,可以绘制图形、显示图像和创建简单的动画。
  • scikit-learn:机器学习库,可以使用各种机器学习技术来创建学习模型并使它们适应预测和分类。除了简单地执行机器学习,scikit-learn还可以用于预处理,例如划分和缩放为训练数据和测试数据。

工欲善其事,必先利其器。scikit-learn 不用考虑,因为入行 2、3 年的人可能都用不到这些东西,咱就拿前三个举例来说先掌握一个数据思维才是最重要的。

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。我收藏了很多技术干货,可以共享给喜欢我文章的朋友们,如果你肯花时间沉下心去学习,它们一定能帮到你,干货内容包括:

👉Python所有方向的学习路线👈

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

👉Python学习开发工具👈

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

在这里插入图片描述

👉Python入门学习视频👈

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

在这里插入图片描述

在这里插入图片描述

👉Python实战练手案例&源码👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉100道Python练习题👈

检查学习结果。

在这里插入图片描述

👉Python大厂面试资料👈

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

👉Python副业兼职学习路线👈

​​在这里插入图片描述

👉 这份完整版的Python全套学习资料已经上传,朋友们如果需要可以扫描下方CSDN官方认证二维码或者点击链接免费领取保证100%免费

读者福利:CSDN大礼包:《Python小白从入门到精通全套学习资料》免费分享 安全链接免费领取

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值