pandas中的数据运算与算数运算

本文详细探讨了pandas中的数据运算,包括DataFrame的算数运算,如加、减、乘、除;DataFrame与Series之间的运算;函数应用和映射;排序和索引操作;汇总计算的描述统计;唯一值、值计数和成员资格分析;以及缺失值处理和填充策略。通过对这些操作的讲解,帮助读者深入理解pandas在数据分析中的强大功能。
摘要由CSDN通过智能技术生成

pandas中的数据运算与算数运算

一,DataFrame中的算数运算

对于DataFrame,对其会同时发生在行和列上,两个DataFrame对象相加后,其索引行和列会取并集,当一个对象中某轴标签在另一个对象上找不到时,会返回NaN.可使用add方法传入特殊值.add(加法),sub(减法),div(除法),mul(乘法)

from pandas import Series,DataFrame
import pandas as pd
import numpy as np
from numpy import nan#导入相应模块
#插入数据
df1 = DataFrame(np.arange(12).reshape((3,4)),columns=list("abcd"))
df2 = DataFrame(np.arange(20).reshape((4,5)),columns=list("abcde"))
df1
df2
df1+df2#df1.add(df2)
df1.add(df2,fill_value=0)# 为df1添加第3行和e这一列,并将其填充为0
df1.add(df2).fillna(0)# 按照正常方式将df1和df2相加,然后将NaN值填充为0

结果如下:
df1df2df1+df2#df1.add(df2)df1.add(df2,fill_value=0)df1.add(df2).fillna(0)

二,DataFrame与Series之间的运算

frame = DataFrame(np.arange(12).reshape((4,3)),columns=list("bde"),
                 index=["Utah","Ohio","Texas","Oregon"])
frame

frame.iloc[1]  # 获取某一行数据  用iloc[]  替换ix[] 方法
frame.index#获取索引
frame.loc["Oregon"]# 根据行索引提取数据
series = frame.iloc[0]
series
frame - series

结果:
这里写图片描述这里写图片描述

三,函数的应用和映射

1,用apply将一个规则应用到DataFrame的行或者列上

f = lambda x : x.max() - x.min()  # 匿名函数
#def getMax(x):#创建函数的方法
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值