美赛python学习d3--数据处理与可视化

文件操作

数据处理工具pandas

pandas的序列与数据框

在这里插入图片描述

1. 序列Series

序列由两列构成,可以由列表,元组,数组,字典构造得到,可以自己命名索引index
创建序列需要用pandas中的Series方法,注意S必须大写
在这里插入图片描述

在这里插入图片描述

2. 数据框DataFrame

相当于是二维表格,可以自己命名行索引和列索引
创建数据框需要使用DataFrame方法
在这里插入图片描述

外部文件的存取

基于pandas库实现文本文件和Excel文件的读取

1. read_csv函数读取txt或csv文件

在这里插入图片描述
在这里插入图片描述

2. Excel文件的读写

需要导入xlrd模块

  1. 从excel中读取数据并进行分析
    利用read_excel函数
    在这里插入图片描述
    在这里插入图片描述
  2. 将数据写入excel中

先创建一个文件对象和数据框,再将数据框利用.to_excel方法
在这里插入图片描述

3. 筛选数据子集
  1. iloc只能通过行号和列号进行数据的筛选,与数组的索引方式相同,都是从0开始
  2. loc可以指定具体的行标签和列标签名
    在这里插入图片描述

Matplotlib数据可视化

matplotlib提出了四种对象容器,Figure,Axes,Axis,Tick
利用matplotlib进行绘图的主要步骤

  1. 导入pyplot模块
  2. 设置绘图的数据和参数
  3. 利用plot,pie,bar,hist,scatter函数进行绘图
  4. 设置绘图的x轴,y轴,标题,网格线,图例等
  5. 调用show函数显示图形

可视化应用

1. 折线图

在这里插入图片描述
可以指定线条的颜色,线条的样式和数据点的形状

2. 散点图和柱状图

在这里插入图片描述

在这里插入图片描述

3. 多个图形显示在同一个画面

在这里插入图片描述

4. 多个图形单独显示

运用subplot函数将屏幕分成多个子窗口,subplot函数接收三个参数row,column和index,整个图被小图分为几行几列,row和column就是几
在这里插入图片描述

5. 三维空间图形的绘制

  • 三维空间的曲线
    将三维曲线用参数方程表示
    在这里插入图片描述

  • 三维空间曲面表面图和网格图

  1. 生成x,y网格数组X,Y
  2. 利用X,Y生成Z的网格数组
  3. 利用plot_surface函数绘制三维图
    在这里插入图片描述
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值