pandas 基本使用方法

python中pandas的数据输出显示设置:https://blog.csdn.net/weixin_43553694/article/details/92798367
https://www.pypandas.cn/docs/getting_started/basics.html
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
DateFrame: index, columns
Pandas 对象(Index, Series, DataFrame)相当于数组的容器,用于存储数据,并执行计算。大部分类型的底层数组都是 numpy.ndarray。
获取 Index 或 Series 里的数据,请用 .array 属性。
在这里插入图片描述
Series 与 Index 的类型是 ExtensionArray 时, to_numpy() 会复制数据,并强制转换值。
to_numpy() 可以控制 numpy.ndarray 生成的数据类型。以带时区的 datetime 为例,Numpy 未提供时区信息的 datetime 数据类型,pandas 则提供了两种表现形式:

一种是带 Timestamp 的 numpy.ndarray,提供了正确的 tz 信息。

另一种是 datetime64[ns],这也是 numpy.ndarray,值被转换为 UTC,但去掉了时区信息。
在这里插入图片描述
获取 DataFrame 里的原数据略显复杂。DataFrame 里所有列的数据类型都一样时,DataFrame.to_numpy() 返回底层数据.
在这里插入图片描述

加速操作:借助 numexpr 与 bottleneck 支持库,pandas 可以加速特定类型的二进制数值与布尔操作.处理大型数据集时,这两个支持库特别有用,加速效果也非常明显。
pd.set_option(‘compute.use_bottleneck’, False)
pd.set_option(‘compute.use_numexpr’, False)
在这里插入图片描述
匹配/广播机制
DataFrame 支持 add()、sub()、mul()、div() 及 radd()、rsub() 等方法执行二进制操作。广播机制重点关注输入的 Series。通过 axis 关键字,匹配 index 或 columns 即可调用这些函数。
在这里插入图片描述
Series 与 Index 还支持 divmod() 内置函数,该函数同时执行向下取整除与模运算,返回两个与左侧类型相同的元组。
缺失值与填充缺失值操作
Series 与 DataFrame 的算数函数支持 fill_value 选项,即用指定值替换某个位置的缺失值。比如,两个 DataFrame 相加,除非两个 DataFrame 里同一个位置都有缺失值,其相加的和仍为 NaN,如果只有一个 DataFrame 里存在缺失值,则可以用 fill_value 指定一个值来替代 NaN,当然,也可以用 fillna 把 NaN 替换为想要的值。
df.add(df2, fill_value=0)
用常数填充:df1.fil

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值