Python数据分析与展示[第三周](pandas数据类型操作)

数据类型操作

如何改变Series/ DataFrame 对象

  • 增加或重排:重新索引
  • 删除:drop
重新索引 .reindex()

reindex() 能够改变或重排Series和DataFrame索引

d.reindex(['c5','c4','v3','v2','c1'])
这样是改变index的顺序

d.reindex(column=['同比',...]
这样是改变column的顺序

.reincdex() 的参数

index,columns 新的行列顺序
fill_value 重新索引中,用于填充缺失位置的值
method 填充方法,ffill 向前填充,bfill 向后填充
limit 最大填充量
copy 默认True,生成新的对象

  • 一个小例子,新增一列
newc=d.colimns.insert(4,'新增’)
newd=d.reindex(columns=newc,fill_value=200)
pandas 的索引类型(index)

.index .columns
index对象是一个不可修改的类型
+索引类型的常用操作

方法说明
.append(ids)链接另一个Index对象,产生新的Index对象
.diff(dix)计算两个Index的差集
.intersection(dix)计算两个Index的交集
.union()计算两个Index的并集
.delete(loc)删除loc位置的元素
.insert(loc,e)在loc位置增加一个元素e

通过操作索引可以操作数据类型

删除指定索引对象

a=pd.Series([9,8,7,6],index=['a','b','c','d'])

a.drop(['b','c'])

使用drop方法删除了这一部分数值(删除某一个index(row))

d.drop(['同比], axis=1) 这样给出axis就可以删除列了。

0 轴是操作index(row)
1 轴是操作column

pandas的数据类型运算

Series DataFram算术运算face

根据行列索引运算,补齐后运算,运算默认产生浮点数

补齐时缺失项填充NAN
二维和一维 一维和0惟 间进行boradcast
采用+-*/符号时产生新的运算对象

  • 例子
    a=pd.DataFrame(np.arange(12).reshape(3,4))
    b=pd.DataFrame(np.arange(20).reshape(4,5))
    a+b 补齐的都是NAN
方法形式的运算
方法说明
.add(d,**argws)类型间加法运算可选参数
.sub
.mul
.div

使用方法好处是可以增加可选参数
fill_value= 补齐的时候使用fill_value来补齐

一维默认在轴一(row)参与运算,
b中给的每一个index(row) 减去a

如果希望在零轴上 (column) b 中的每一个column减去 a

比较运算

只比较相同索引的元素,不补齐
不同维度的boradcast 默认时1轴(每一个index(row) 都作用到a))上

转载于:https://www.cnblogs.com/sfzyk/p/6877796.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值