一、数据分析介绍与环境搭建

一、数据分析简介

1.1 什么是数据分析

数据分析是指明适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概况总结的过程。数据分析的目的有多种,概括起来有三种:现状分析、原因分析、预测分析。现状分析简单来说就是告诉你过去发生了什么。原因分析简单来说就是告诉你某一现状为什么发生。预测分析简单来说就是预测未来会发生什么

1.2 数据分析步骤

数据分析主要有六个过程

  1. 需求明确:明确作数据分析的目标。为后面的分析过程做好铺垫
  2. 数据收集:通过爬虫、商务合作的方式,获取想要的数据
  3. 数据处理:对获取来的数据进行处理和清洗,把不需要的剔除掉,把需要的加工成我们想要的。方便后面的分析
  4. 数据分析:根据自己的目的,以及现有的数据确定好分分析的方法
  5. 数据展现:将数据按照确定好的分析方法展示出来
  6. 撰写报告:将分析的结果通过图标和文字的方式形参报告文档

1.3 数据分析的误区

  1. 分析目的不明确,为分析而分析:一定要找准自己分析数据的目标而去分析,比如要了解现状,还是找出原因,还是预测未来发展等,千万不要为了分析而分析,这样就偏离主题了
  2. 缺乏业务知识,分析结果偏离实际:分析数据的时候,一定要和公司的业务结合起来。如果脱离业务,即使数据分析方法再厉害,图标再优美,也无济于事
  3. 追求高级分析方法:一些人喜欢用一些高级的分析方法,认为只哟局这样才能体现专业性。其实高级的数据分析方法不一定是最好的,能够简单有效的解决问题的方法才是最好的

1.4 数据分析的方法和工具

数据分析可以通过工具,也可以通过代码来实现。以下分别列出这些常用的:

  1. 工具:Excel、Tableau、SPSS、百度图说等
  2. 编程:Python语言、R语言、数据库的SQL语言、Excel的VBA语言等

1.5 工具和代码该怎么选

两者没有好坏之分,只有合适之分。数据分析总体来讲有两个模块,一个是数据处理,一个是可视化。如果数据已经经过处理了,并且手头上的软件可以直接非常方便的做可视化处理,那么我们用软件实现就可以。如果数据没有经过处理,那么最好通过python或者r对数据进行有一些处理,然后再通过软件可视化。或者软件的可视化无法满足我们的要求,那么可以通过代码来实现。总而言之,工具比较功能无法100%的满足你的要求,但是效果高。代码作数据处理比较好,最后数据可视化比较繁琐,但是DIY属性强

二、环境搭建

2.1 Python版本

本课程用到的Python版本都是3.x。要有一定的Python基础,知道列表、字符串、函数等的用法

2.2 Anaconda

Anaconda(水蟒) 是一个捆绑了Python、conda、其他相关依赖包的一个软件。包含了180多个科学计算包及其依赖。Anaconda3继承了Python3的环境,Anaconda2是集成了Python2的环境。Anaconda默认集成的包,是属于内置的Python的包。并且支持绝大部分操作系统(比如:Window、Mac、Linux等)。在安装完成后,会有以下几个模块:Anaconda prompt、Anaconda Navigator、Spyder、jupyter notebook

2.3 Anaconda prompt

Anaconda prompt 是专门用来操作anaconda的终端。如果你安装完 Anaconda 后没有在环境变量的 PATH 中添加相关的环境变量,那么以后你想在总终端使用 Anaconda 相关的命令,则必须要在 Anaconda prompt 中完成
在这里插入图片描述

2.4 Anaconda Navigator

Anaconda 的图形化导航界面
在这里插入图片描述

2.5 Spyder

一个专门开发 Python 的软件,熟悉 MATLAB 的同学会比较有亲切感,但在后期的学习过程中,我们将不会使用这个工具写代码,因为还有更好的可替代的工具

2.6 jupyter notebook

一个Python编辑环境,可以实时的查看代码的运行效果
在这里插入图片描述

三、jupyter notebook的使用(略)

  • 14
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ModelBulider

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值