数据分析的简介

数据分析

  1. 什么是数据分析
    数据分析是指适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总理解并笑话,以求最大化的开发数据的功能,发挥数据的作用。数据分析是为了提取有用的信息和形成结论而对数据加以详细研究和概括的过程
  • 数据分析方法:
    • excel数据分析
    • MATLAB 绘图工具 收费
    • 编程语言
      • python:最常用的语言
      • c++: 需要低延迟、高执行效率和封装应用的时候
      • R:专用于统计分析和绘图
  1. 数据分析的三大块
  • python数据分析三大基础模块
    • Matplotlib: 绘图库 pyplot
    • Numpy: 数值计算库 ndarray
    • pandas: 数据分析库 Dataframe
  1. 数据分析流程
  • 需求层面
    • 目标明确
  • 数据层
    • 数据获取
    • 数据清洗
    • 数据重构
      • 数据规划化
      • 数据转化
  • 分析层
    描述性分析
    探索性分析
    • 建模分析
    • 模型验证
    • 迭代优化
  • 输出层面
    • 洞察结果,成果可视化
  1. 开发工具
  • anaconda+jupyter notebook

    • Anaconda是一个用于科学计算的python发行版(软件)
    • Anaconda构建了一个数据科学开发环境,它本身就构成了一个数据科学开发圈
    • Anaconda支持Linux、Mac、windows系统
    • Anaconda内置了
      • conda包和环境管理器
      • python2/3的内核
      • Ipython/Jupyter/Spyder等代码编辑器/IDEA
      • Numpy/Matplotlib/pandas等150多种科学计算包
  • Jupyter Notebook

  • python+pycharm
    python 用3.95的版本会比较好

  1. Matplotlib
    • Matpotlib是最流行的python数据可视化的第三方库

    • 名字取材于MATLAB,中间夹上plot

    • 模仿MATAB构建

    • 需要通过 pip install matplotlib 来安装使用

    • 入门


from matplotlib import pyplot as plt

plt.plot([0,2,4,6,8],[1,5,3,9,7])
plt.show()

以下是效果图:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jrTL98xx-1654272707829)(https://note.youdao.com/yws/res/1041/WEBRESOURCE7a4263acccc5162bac466694f02ebd28)]

从这里我们可以清晰地看出来传入的第一个数组是他的x坐标,第二个数组是他的Y坐标

  1. plot绘图

# 折线图方法
plt.plot(x,y,,format_string,**kwargs)

--------------------------------------------------

参数说明:
    y : Y轴的数据,列表或者数组,必填
    x :X轴的数据,列表或者数组,必填
    format_string : 线条的样式、格式字符串,可填可不填
    **kwargs : 第二组或更多(x,y,format_string),多组参数,多条线条
    
  • 绘制一条线时,x轴可以省略,默认y轴数据的索引代替

from matplotlib import pyplot as plt as plt

plt.plot([0.2.4.6.8]) # 默认X轴坐标
plt.plot([0.2.4.6.8],[1,3,5,7,9]) # x轴坐标值,Y轴坐标值


画两条线:

plt.plot([0, 2, 4, 6, 8])   # 默认传入y轴的数据
plt.plot([0, 2, 4, 6, 8], [1, 3, 5, 7, 9])
plt.show() # 将图片展示出来

例子:
温度变换:

x = range(1,16)
y = [18, 20, 22, 22, 34, 26, 27, 27, 29, 30, 30, 26, 22, 28, 29]
# y轴的数据,1-15号每天的最高温
plt.plot(x, y)  # 绘画x,y轴的数据
plt.show()  # 展示

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rM4xse63-1654272707830)(https://note.youdao.com/yws/res/1110/WEBRESOURCE01ef99e9b5c4bb20fef15efeb2805aa5)]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值