python数据预测——学习数据分析需要多少python基础?

33 篇文章 0 订阅
32 篇文章 0 订阅
本文介绍了Python数据分析的基础,包括环境搭建、学习路径和重要库的使用,强调了数据和理论知识的重要性。推荐了数据分析流程PPDAC,并提供了学习资源,如Python基础、统计学和数据分析工具Pandas、Numpy和PyEcharts。
摘要由CSDN通过智能技术生成

前言

工欲善其事,必先利其器,

搭建Python环境、学习Python语言、理解数据分析工作是入行Python数据分析最基本的三要素。但是还要有个最重要的前提是经验和思维。

这个过程就好比做日料,首先要有厨具,菜谱才能做出来,而最重要的是食材,毕竟巧妇难为无米之炊。

【----帮助Python学习,以下所有学习资料文末免费领!----】

做数据分析也是一样,你要有开发环境,掌握代码的基本操作,数据分析的基本步骤才能做出来分析结果,而这最重要的就是数据。

没数据你分析个啥?

光会技能也是不够的,也需要基础的理论知识。如果没有基础的数据分析理论的话未来可能路会走歪大概率会成为一个码农。

不会理论怎么办?

想要成为一名合格的数据分析师,为什么必须要学统计?

如果觉得我说的这些内容比较难看懂,推荐可以看一下猴子老师的数据分析基础入门课程理论基础的部分,掌握数据分析的理论是有助于掌握数据分析思维,通过科学的方法对实际工作中的数据分析部分进行操作,可以让零基础的你对枯燥无味的数据分析理论产生兴趣,并能够在工作中快速的提升自己的业务水平。

数据分析流程思维 PPDAC

数据分析基本步骤

理解问题(Problem)

对于实际业务中发生的Case需要进行数据分析,首先要清楚问题是什么?方向一点错了后面所有的努力都是徒劳,以及判断问题是否需要进行数据分析?

一般步骤来说就是表明发现的问题,然后做出一个假设。

比如说现在有个问题银行贷款放款金额有业绩环比下降趋势是什么原因,我们就要假设和各种因素有关联去分析,比如风控规则重新制定?银行利率?政策关系?等等需要进行量化才能得到答案。

调查计划(Plan)

确定好分析目标之后就要制定分析调查计划,考虑到刚才说的一些可能影响的相关因素,例如风控规则重新制定、银行利率、政策关系等等。

其实这些就是我们后期用于数据分析的数据,基于数据的种类分成四大类:

  1. 列联表数据:最基础的就是经常看到的Excel表格数据,高级一点就是MySQL、Mongodb数据仓库中的数据。这部分内容需要根据调查计划设计表单的字段信息,用于后期数据采集的填充。
  2. 文本数据:俗称自然语言处理(NLP),就是我们经常看到的文本数据信息。
  3. 视频数据:和分析有关的视频内容。
  4. 音频数据:和分析有关的视频内容。
  5. 图像数据:和分析有关的视频内容。

数据采集(Data)

确定目标数据以及采集方式(购买或者网络采集)。

数据采集的一般方式有调查问卷(推荐问卷星,上手简单),查询各种资料网站等等。这里罗列基于Python的5中数据采集获取的方式:

  1. 数据档案文件:数据文件是存储数据的文件。从广义上讲,存储在任何文件中的信息都可以称为数据。从狭义上讲,以数字或文本形式存储在数据文件中的结构化数据记录是数据。
  2. 数据库:是根据数据结构组织,存储和管理数据的仓库。数据库广泛用于CMS(内容管理系统),CRM(客户关系管理系统),OA(办公自动化),ERP(企业资源计划),财务系统,DSS(决策支持系统),数据仓库和数据集市,导入销售和库存管理,生产管理,仓库管理等业务运作。
  3. 使用Python获取数据:俗称网络爬虫通过技术手段大规模的抓取网站上的数据信息。
  4. 从Excel,数据仓库获取数据:在实际的企业解决方案中,由于Excel本身的应用范围和限制,它无法存储和计算过多的数据(例如数千万条数据记录),并且Excel本身并不是为海量数据的应用而创建的。因此,Excel可以用于日常基本数据处理,补充数据源或摘要数据,也可以用作显示数据结果的载体。此应用程序对于显示大量数值表非常有效。
  5. 从API获取数据:基本上从API获取数据需要一些技术支持,当然这些数据价值也是可以的,不过也需要付出一些费用。比如万德、万方这样收费较高的数据库,用于行业研究和论文撰写还是有必要的。

数据分析(Analysis)

对于数据分析,重要的是总结数据,检查数据的趋势,并引导下一步行动。

数据分析的方法有很多种,未必专家的建议就是对的,只要能把自己分析的流程以及逻辑说明白,然后通过不同的方式,编程也好、工具也罢能得到一个清晰的结果就可以了。

比如经常用的分析方法有相关分析、聚类分析、回归分析、分类分析等等,覆盖了新手起步阶段的全部方法,毕竟太高端的作为初入行的小伙伴来说是用不上的。

考虑结论(Conclusion)

最根据分析结果得出结论,将创建一份分析报告,并根据分析结果提出将导致有价值的措施的行动。重要的是要考虑一个人可以得出的结论。

但是由于问题并不总是通过一个 PPDAC 周期来解决,因此将多次重复此 PPDAC 周期来解决问题。

这里就要掌握一个制作PPT的正确姿势和思路,这个是要用最少的文字以及适合的图形把分析结果展示给需要的人,这就成功了。

成长靠自己

切莫做伸手党,数据分析是一个熟练工成长过程,记得多看、多听、多记、多总结。

要记住你是数据分析师,而不是xxxx工程师,比的不是谁代码敲的好,而是能通过数据发现问题、分析问题、最终提出问题解决方法才是最重要的。

这个是我数据分析师成长道路上的一点小小成绩,供参考。

零基础数据分析的我用了半年时间利用信用卡交易数据建模协助警方破获电信诈骗集团

数据分析这条路其实并不太好走,我是自学的,如果当初能有人引导我的话可能会成长的更快一些。如果真的下决心入行数据分析,推荐看下猴子老师的数据分析入门课程,3天的时间过来看看自己是否能真的入行。

Python环境搭建

这里建议你不要耍帅买个苹果Mac这种,工作做到后期你发现你的笔记本配置跟不上,除非你花大价钱去换更好的。建议还是老老实实的买个国产笔记本就可以了,优先考虑散热,毕竟数据分析计算起来那个热量跟打游戏一样,优先考虑考虑散热好的笔记本。

环境搭建建议直接使用Anacanda,许多操作系统例如 macOS 和 Linux,都预装了 Python。操作系统附带的 Python 版本称为系统 Python。系统 Python 几乎总是过时的,甚至可能不是完整的 Python 安装。所以拥有最新版本的 Python 非常重要。

你要明白你是专业的程序工程开发人员还是非专业的程序工程开发人员。因为不同角色使用的Python环境是不一样的。

Anaconda 图形操作系统环境安装

macOS 、Linux系统图形界面、Ubantu系统图形界面安装流程通用。

Jupyter Notebook 是一款开源 Web 应用程序,Jupyter 这个名字来源于它支持的核心支持的编程语言:Julia、Python 和 R。可用于创建和共享包含实时代码、方程式、可视化和文本的文档。Jupyter 附带 IPython 内核,允许使用 Python 编写程序,但目前还有 100 多个其他内核可供使用。

Python编程基础知识

这部分内容建议不要花太多时间学习到一个完美的结果。可以在后续分析过程中写代码的时候去学习,比现在把每个语法一个一个地完善起来要好得多。这里给你列一个我自学后整理的几个重要的知识点。

  1. 数据类型和基本用法
  2. 数值和字符串运算
  3. 条件if语句控制语法/条件分支
  4. 循环for语句和while语句进行迭代处理
  5. 函数的创建
  6. 变量范围处理
  7. 面向对象的理解(类、属性、方法、继承、封装、多态)
  8. 列表、元组、集合和字典的含义和用法
  9. 映射、过滤器、lambda

Python数据分析常用库

作为数据分析师来说,常用的Python库其实非常有限,主要看使用者是否能够灵活使用应用到实际工作中。

  • Pandas: 用于数据分析/分析的库,可以进行数据读取处理、统计显示等预处理。
  • Numpy: 数值计算库,经常用于机器学习,因为它支持简单符号的高速矩阵运算。
  • PyEcharts: 用于数据可视化的库,可以绘制图形、显示图像和创建简单的动画。
  • scikit-learn: 机器学习库,可以使用各种机器学习技术来创建学习模型并使它们适应预测和分类。除了简单地执行机器学习,scikit-learn还可以用于预处理,例如划分和缩放为训练数据和测试数据。

作为入门阶段来说最后的 scikit-learn 不用考虑,因为入行2、3年的人可能都用不到这些东西,咱就拿前三个举例来说先掌握一个数据思维才是最重要的。

Python入门教程

如果你现在还是不会Python也没关系,下面我会给大家免费分享一份Python全套学习资料, 包含视频、源码、课件,希望能帮到那些不满现状,想提升自己却又没有方向的朋友,可以和我一起来学习交
流。

① Python所有方向的学习路线图,清楚各个方向要学什么东西

② 600多节Python课程视频,涵盖必备基础、爬虫和数据分析

③ 100多个Python实战案例,学习不再是只会理论

④ 华为出品独家Python漫画教程,手机也能学习

⑤ 历年互联网企业Python面试真题,复习时非常方便

在这里插入图片描述

👉Python学习视频600合集👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

👉实战案例👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉100道Python练习题👈

检查学习结果。

👉面试刷题👈

在这里插入图片描述

资料领取

这份完整版的Python全套学习资料已经上传网盘,朋友们如果需要可以点击下方微信卡片免费领取 ↓↓↓【保证100%免费】
或者

点此链接】领取

好文推荐

了解python的前景:https://blog.csdn.net/weixin_49891576/article/details/127187029

了解python的兼职:https://blog.csdn.net/weixin_49891576/article/details/127125308

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值