Python之Numpy之pandas

最新推荐文章于 2024-08-21 23:19:44 发布

柏树之路

最新推荐文章于 2024-08-21 23:19:44 发布

阅读量2.1k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/elwangeij/article/details/51276727

版权

3 篇文章 0 订阅

订阅专栏

pandas调用：import pandas as pd

两大数据结构：Series 和DataFrame

Seires两大属性： values 和 index

nindex=['adf','dasf','fda','erdf'] obj4=Series(data, index=nindex) 若出现NaN，则可用isnull和notnull来检测数据丢失。

2 DataFrame（表示一个表格）

构建一个DataFrame，最常用的是用等长度列表的字典或者Numpy数组

一列可通过字典记法或属性来检索：frame[' asdf ']或者frame.asdf 一行可通过frame.ix[' one ']

values, columns, index

删除列：del frame2[' dafad ']

嵌套字典的字典格式传递给DataFrame,则外部键作为列索引，内部键作为行索引。

DataFrame支持转置

可能传递到DataFrame的构造器
二维ndarray	一个数据矩阵，有可选的行标和列标
数组，列表或元组的字典	每一个序列成为DataFrame中的一列。所有的序列必须有相同的长度。
NumPy的结构/记录数组	和“数组字典”一样处理
Series的字典	每一个值成为一列。如果没有明显的传递索引，将结合每一个Series的索引来形成结果的行索引。
字典的字典	每一个内部的字典成为一列。和“Series的字典”一样，结合键值来形成行索引。
字典或Series的列表	每一项成为DataFrame中的一列。结合字典键或Series索引形成DataFrame的列标。
列表或元组的列表	和“二维ndarray”一样处理
另一个DataFrame	DataFrame的索引将被使用，除非传递另外一个
NumPy伪装数组（MaskedArray）	除了蒙蔽值在DataFrame中成为NA/丢失数据之外，其它的和“二维ndarray”一样

索引方法和属性
append	链接额外的索引对象，产生一个新的索引
diff	计算索引的差集
intersection	计算交集
union	计算并集
isin	计算出一个布尔数组表示每一个值是否包含在所传递的集合里
delete	计算删除位置i的元素的索引
drop	计算删除所传递的值后的索引
insert	计算在位置i插入元素后的索引
is_monotonic	返回True，如果每一个元素都比它前面的元素大或相等
is_unique	返回True，如果索引没有重复的值
unique	计算索引的唯一值数组