Matplotlib、Pandas可视化工具

matplotlib:画图
numpy:处理数值型数组
pandas:在numpy基础上处理各种数据类型

一、Matplotlib

1.简介:

  • 数据可视化可以看到变量的分布和变量之间的关系,还可以检查建模过程中的假设。
  • Python 提供了若干种用于绘图的扩展包,包括:Matplotlib、 Pandas、 ggplot 和 Seaborn等。
  • Matplotlib 是最基础的扩展包,它为 Pandas 和 Seaborn 等其他可视化包提供了一些基础的绘图概念和语法。
  • 通过Matplotlib,开发者可以仅需要几行代码,便可以生成绘图。一般可绘制折线图、散点图、柱状图、饼图、直方图、子图等。

2.安装:

在Service中输入:pip install matplotlib 自动导入

3.导包:

import matplotlib.pyplot as plt
或
form matplotlib import pyplot as plt

4.使用方法:

import numpy as np
import matplotlib.pyplot as plt
x=np.linspace(1,50,100)     #定义x数据范围
y=3*x+1
plt.figure()                #定义一个图像窗口
plt.plot(x,y)               #plot()画出曲线
plt.show()                  #显示图像

'''
plt.figure()为单独图像窗口,语法如下:
figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, ……)
1.num:可选参数。窗口的属性id,即该窗口的身份标识。如果不提供该参数,则创建窗口的时候该参数会自增,如果提供的话则该窗口会以该num为Id存在。
2.figsize:可选参数。整数元组,默认是无。提供整数元组则会以该元组为长宽。
3.dpi:可选参数,整数。表示该窗口的分辨率。
4.facecolor:可选参数,表示窗口的背景颜色,如果没有提供则默认为figure.facecolor。颜色的设置是通过RGB,范围是'#000000'~'#FFFFFF'。
5.edgecolor:可选参数,表示窗口的边框颜色
'''

在这里插入图片描述

#1.xlim和ylim定义坐标轴的上下限,xlabel和ylabel定义坐标轴的名称。
plt.xlim(-2,4)
plt.ylim(-5,15)
plt.xlabel("I'm x")
plt.ylabel("I'm y")
#2.xticks和yticks为定义坐标轴刻度
plt.xticks(new_ticks)
plt.yticks([-5,0,5,10,15],['very bad','bad','normal','good','very good'])
#3.linewidth:线条宽度,取值0-10之间,默认是1.5 linestyle:线条样式,可取“-”,“--”,“-.”,“:”四种,默认为“-”
plt.plot(x,y,linestyle='--',linewidth=2)
#4.图例:
plt.plot(x,y2,label='y2=x^2')

二、Pandas

1.简介:

  • Pandas是一个非常强大的数据分析工具包,同时集成了数据可视化的功能, pandas中的可视化功能比plt更加简便和功能强大。

2.使用方法:

  • plot()方法是pandas绘图的高级绘图函数,可通过kind的设定,绘制出各类图形,其语法如下:
DataFrame.plot(x=None, y=None, kind='line', ax=None, subplots=False,sharex=None, sharey=False, layout=None, figsize=None, use_index=True, title=None, grid=None, legend=True, style=None, logx=False, logy=False, loglog=False, xticks=None, yticks=None, xlim=None, ylim=None, rot=None, fontsize=None, colormap=None, table=False, yerr=None, xerr=None, secondary_y=False, sort_columns=False, **kwds)
'''
x: 做为x轴的参数
y: 做y的属性
kind: 代表所做图形的类别,其可选参数为: ‘line’,‘bar’,‘barh’,‘hist’,‘box’,‘kde’,‘density’,‘area’,‘pie’,‘scatter’,‘hexbin’等
ax: 轴对象,默认使用gca()
subplots: boolean  每列单独做子图
sharex: boolean 是否共享x轴
sharey:    boolean 是否共享y轴
layout : tuple  表示子图的布局
figsize : 以英寸为单位的元组(宽,高)
use_index:  使用index作为x轴的刻度
title: 字符串或列表  做图的标题
grid:是否显示网格线
legend: 是否显示图例
style: 每列的样式
logx,logy: 在x,y轴上使用对数缩放
xticks,yticks: x,y轴标签
xlim,ylim: x,y轴刻度限制
rot:旋转刻度
fontsize: xticks和yticks的字体大小
colormap: 用于选择颜色
colorbar: 如果为True,则绘制colorbar(仅与'scatter'和'hexbin'图相关)
position: 指定条形图布局相对齐
table: 如果为True,则使用DataFrame中的数据绘制表格,并且数据将被转置以满足matplotlib的默认布局。 如果传递了Series或DataFrame,则使用传递的数据绘制表。
yerr ,xerr带误差线的柱形图
stacked: 在线条和条形图,以及区域图中的True。 如果为True,则创建堆积图。
sort_columns: 对列名进行排序
secondary_y: 是否绘制辅助y轴
mark_right: 使用辅助y轴时,图例中使用right标记列标签
'''
  • Pandas数据结构:
    在这里插入图片描述
#根据数据画图
import pandas as pd
import matplotlib.pyplot as plt

d_dict = {'A':['1','2','3'],'B':[4,5,6],'C':[7,8,9],'D':[10,11,12]}
index_name = ['a','b','c']
df = pd.DataFrame(data=d_dict,index=index_name)

print(df)

df.plot(kind='bar')
plt.show()

print(df.loc['b','B'])#b行B列元素
print(df.loc[['b','c']])#b行和c行元素
print(df.loc[:,['B','C']])#B列和C列元素

#确认一个卷积核,然后对应点相乘,6*6矩阵和3*3卷积核形成4*4矩阵

在这里插入图片描述

三、Sklearn

1.简介:

进行函数预测

2.使用方法:

#根据数据构建线性方程
import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import LinearRegression

x=[4000,8000,5000,10000,12000]
y=[20000,50000,30000,70000,60000]

plt.figure()
plt.scatter(x,y)
plt.show()

lr = LinearRegression()

x = np.array(x).reshape(-1,1)#多少行不管设-1,列设为1

model = lr.fit(x,y)
#预测函数:y=ax+b
print(model.coef_)#a
print(model.intercept_)#b

在这里插入图片描述

  • 9
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: Pandas 是一个强大的数据分析工,它可以帮助您读取和处理各种数据格式(如 CSV、Excel、JSON 等)。 Matplotlib 是一个用于绘制图形的库,它可以与 Pandas 配合使用,通过绘制图表来可Pandas 中的数据。 通过使用 PandasMatplotlib,您可以方便地对数据进行分析和可化。 ### 回答2: PandasMatplotlib是Python编程语言中非常有用的两个库,特别是在数据科学和数据分析中。这两个库都可以方便地处理和可化数据。 Pandas是一个强大的数据分析库,可用于读取,处理和分析数据。它支持不同类型的数据结构,包括数据帧(DataFrame)和系列(Series)。使用Pandas,我们可以轻松地载入数据集,并进行数据清洗、数据处理和数据分析。常用的数据操作包括筛选、排序、聚合、合并等。 Matplotlib是一个Python绘图库,可用于创建各种静态、动态或交互式的图表和可化效果。它支持绘制线条图、散点图、饼图、直方图等基本图表类型,并提供了多种自定义选项和功能,以满足不同可化需求。使用Matplotlib,我们可以简单地绘制出高质量的图表和可化效果,从而更好地理解数据和探索数据特征。 使用PandasMatplotlib进行可化,一般需要先载入数据集,并对数据进行清洗和处理,以便后续进行可化分析。然后根据需要,选择适当的可化类型,并使用Matplotlib提供的函数和工绘制出所需的图表。在图表绘制完成后,我们可以使用Matplotlib提供的多种自定义选项和功能调整图表样式和外观,使其更可读性和直观性。最后,我们可以保存或分享图表和可化效果,以便更好地展示和交流数据分析结果。 总结来说,PandasMatplotlib是Python编程中非常实用的两个库。使用Pandas可以方便地读取和操作数据集,使用Matplotlib则可以快速绘制出各种图表和可化效果。掌握这两个库的使用技巧,可帮助我们更好地进行数据分析和探索,从而得出更准确和可靠的结论。 ### 回答3: 为了更好地进行数据分析和呈现,pandas提供了很多功能强大的数据处理和数据结构操作,而matplotlib则是Python中最著名的绘图库之一,通过将pandasmatplotlib结合起来使用,可以极大地提高数据分析和可化的效率和准确性。以下是Pandas Matplotlib化的一些主要内容。 #1. 创建简单的数据可Pandas Series和DataFrame提供了许多内置绘图方法,通过调用这些方法,可以轻松地创建数据可化图表。例如,可以通过调用pandas.DataFrame.plot()方法,来创建简单的折线图、散点图、柱状图、区域图等常用的图表类型。 #2. 数据预处理与清洗 Pandas提供了很多功能强大的数据预处理和清洗工,包括数据清洗、数据规整、数据转换等。通过使用这些工可以更好地准备数据以供可化使用,这对于正确地理解和分析数据是非常重要的。 #3. 多个子图和复杂图表的创建 PandasMatplotlib支持Subplot、Axes和Figure等用于创建复杂图表的对象和方法。可以使用这些对象来创建多个子图、绘制复杂图形、添加注释和轴标签等。 #4. 可交互的数据可化 在使用PandasMatplotlib创建的图表中,可以使用交互式可化工来导航和探索数据。通过使用一些Python库如Bokeh和Plotly等,可以创建高度交互式和动态的图表和可化效果。 #5. 高级数据分析和可化 除了常规的数据可化图表之外,PandasMatplotlib还支持一些高级的数据分析和可化技术,例如,时间序列分析、统计分析、数据聚合、可化编码和机器学习方法等。这些技术可以被用于更好地分析和理解数据,建立高度定制化和交互式的数据可化应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

姓蔡小朋友

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值