包括两个数据结构: DataFrame和Series
正式文件地址:
熊猫
系列
数据框
I. 熊猫介绍
1. Python数据分析库或pandas是基于NumPy的工具,旨在解决数据分析任务. Pandas包含大量库和一些标准数据模型,以提供有效操作大型数据集所需的工具. 熊猫提供了大量的功能和方法,使我们能够快速,轻松地处理数据. 您很快就会发现,这是使Python成为强大而高效的数据分析环境的重要因素之一.
2. Pandas是用于Python的数据分析包. 它最初由AQR Capital Management于2008年4月开发,并于2009年底开源. 目前,它由致力于Python数据包开发的PyData开发团队开发和维护. 成为PyData项目的一部分. Pandas最初是作为财务数据分析工具开发的. 因此,熊猫为时间序列分析提供了良好的支持. Pandas这个名字来自面板数据和python数据分析. 面板数据是经济学中多维数据集的术语. 熊猫也提供面板数据类型.
发件人:
3. Pandas是Python的大数据处理模块. Pandas使用二维数据结构DataFrame表示表格式数据. 与Numpy相比,Pandas可以存储混合数据结构并使用NaN表示丢失的数据,而不是像Numpy那样手动处理丢失的数据. 而且Pandas使用轴标签来表示行和列.
DataFrame类:
DataFrame具有四个重要属性:
index: 行索引.
列: 列索引.
values: 二维值数组.
名称: 名称.
原始链接:
4,熊猫和numpy
Pandas是Python环境中最著名的数据统计软件包,DataFrame被转换为数据框架,这是一种数据组织方式. 因此,您可能无法在情感上知道它. 例如,您可能使用过Excel,它也是一种数据组织和表示的方式,它只是一个表python库,而DataFrame用于组织熊猫中的数据. 如果不打印DataFrame,则看不到数据.
pandas和numpy之间的区别:
(1)numpy是用于数值计算的扩展包,而panadas用于数据处理.
(2)NumPy简介: N维数组容器NumPy系统是Python的开源数值计算扩展. 该工具可用于存储和处理大型矩阵,这比Python自己的嵌套列表结构(此结构也可用于表示矩阵)要高效得多. 据说NumPy可以将Python转换为免费且功能更强大的MatLab系统.
Pandas简介: 表格容器pandas是基于NumPy的工具,它是为解决数据分析任务而创建的. Pandas包含大量库和一些标准数据模型,以提供有效操作大型数据集所需的工具. 熊猫提供了大量功能和方法,可快速轻松地处理数据. 使Python成为强大而高效的数据分析环境的重要因素之一.
参考:
第二,系列和数据框
Pandas是一个由Numpy构建的数据分析包,其中包含更多高级数据结构和工具.
类似于Numpy,核心是ndarray,pandas也围绕Series和DataFrame的两个核心数据结构构建. Series和DataFrame分别对应一维序列和二维表结构. 熊猫的常规导入方法如下:
从pandas导入Series,DataFrame
将熊猫作为pd导入
系列:
Series对象包含两个主要属性: 索引和值,它们是上例中的左列和右列.
将严格根据给定的索引来构造Series对象的元素,这意味着: 如果data参数具有键值对,则仅使用索引中包含的键;如果数据中缺少响应键,即使给出了NaN值,也会添加该键.
DataFrame:
DataFrame是一个表格数据结构,它包含一组有序的列(类似于索引),每个列可以是不同的值类型(与ndarray只能具有dtype不同). 基本上,您可以将DataFrame视为共享相同索引的Series的集合.
DataFrame的构造方法与Series相似,不同的是它可以同时接受多个一维数据源,每个数据源将成为一个单独的列:
DataFrame.loc([行名],[列名])
DataFrame.iloc([行号]python库,[列号])
参考:
三,汇总图
参考:
Python库-------熊猫
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-267646-1.html