Python三剑客指的是Pandas、Numpy和Matplotilb这三个库,它们在数据分析领域扮演着核心角色。它们各自拥有独特的功能和优势,结合使用可以极大地提高数据分析的效率和准确性。
一、Numpy
NumPy是使用Python进行科学计算的基础包。它包含如下的内容:
- 一个强大的N维数组对象。
- 复杂的(广播)功能。
- 用于集成C / C ++和Fortran代码的工具。
- 有用的线性代数,傅里叶变换和随机数功能。
除了明显的科学用途外,NumPy还可以用作通用数据的高效多维容器。可以定义任意数据类型。这使NumPy能够无缝快速地与各种数据库集成。
中文:NumPy这是NumPy官方的中文文档,NumPy是用Python进行科学计算的基础软件包。https://www.numpy.org.cn/
二、Pandas
Pandas 是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的, Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
Pandas可以和Jupyter工具包和其他库结合使用,在进行数据分析时,其性能、效率、协作能力都是十分优秀的。
导包方式
import pandas as pd
Pandas包含两个主要的数据结构:(一维数据)Series和(二维数据)DataFrame,可以应用于金融、统计、工程等诸多领域。
Series:一维数组,与Numpy中的一维array相似,两者与python的数据结构List也相近,可以保存不同种类的数据类型。
DataFrame:二维的表格型数据结构,可以看成是由Series组成的字典(共用同一索引),可以将DataFrame理解为Series的容器。
官网:PandasPandas中文网、Pandas官方中文文档。https://pypandas.cn/
三、Matplotlib
Matplotlib 是 Python 中最受欢迎的数据可视化软件包之一,支持跨平台运行,它是 Python 最常用的 2D 绘图库,同时它也提供了一部分 3D 绘图接口, Matplotlib 通常与 NumPy、Pandas 一起使用,是数据分析中不可或缺的重要工具之一。
通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图、折线图、直方图、功率谱、条形图、错误图、散点图等,同时也可以对不同图形进行设置,调整颜色,尺寸,距离等。