Python之Numpy之pandas

pandas调用:import pandas as pd

两大数据结构Series DataFrame

1 Series

Seires两大属性: values index

  • obj2=Series([4,7,-5,3], index=[ 'd','b','a','c' ])
  • data={'dfs':435, 'dsfa':54423, 'gfsd':6534}      obj3=Series(data)
  • nindex=['adf','dasf','fda','erdf'] obj4=Series(data, index=nindex)        若出现NaN,则可用isnull和notnull来检测数据丢失。

2 DataFrame(表示一个表格)

构建一个DataFrame,最常用的是用等长度列表的字典或者Numpy数组

一列可通过字典记法或属性来检索:frame[' asdf ']或者frame.asdf  一行可通过frame.ix[' one ']

values, columns, index

删除列:del frame2[' dafad ']

嵌套字典的字典格式传递给DataFrame,则外部键作为列索引,内部键作为行索引

DataFrame支持转置


可能传递到DataFrame的构造器
二维ndarray一个数据矩阵,有可选的行标和列标
数组,列表或元组的字典每一个序列成为DataFrame中的一列。所有的序列必须有相同的长度。
NumPy的结构/记录数组和“数组字典”一样处理
Series的字典每一个值成为一列。如果没有明显的传递索引,将结合每一个Series的索引来形成结果的行索引。
字典的字典每一个内部的字典成为一列。和“Series的字典”一样,结合键值来形成行索引。
字典或Series的列表每一项成为DataFrame中的一列。结合字典键或Series索引形成DataFrame的列标。
列表或元组的列表和“二维ndarray”一样处理
另一个DataFrameDataFrame的索引将被使用,除非传递另外一个
NumPy伪装数组(MaskedArray)除了蒙蔽值在DataFrame中成为NA/丢失数据之外,其它的和“二维ndarray”一样


索引方法和属性
append链接额外的索引对象,产生一个新的索引
diff计算索引的差集
intersection计算交集
union计算并集
isin计算出一个布尔数组表示每一个值是否包含在所传递的集合里
delete计算删除位置i的元素的索引
drop计算删除所传递的值后的索引
insert计算在位置i插入元素后的索引
is_monotonic返回True,如果每一个元素都比它前面的元素大或相等
is_unique返回True,如果索引没有重复的值
unique计算索引的唯一值数组

重新索引:reindex




参考资料:http://pda.readthedocs.io/en/latest/chp5.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值