python程序调优：替换pandas包的Series与DataFrame构造与计算

呆萌的代Ma

已于 2022-03-21 15:29:59 修改

阅读量1.5k

点赞数

分类专栏：程序优化文章标签： pandas 优化

于 2022-03-21 15:29:53 首次发布

本文为CSDN博主"呆萌的代Ma"原创文章，转载请注明博客链接：https://blog.csdn.net/weixin_35757704/

本文链接：https://blog.csdn.net/weixin_35757704/article/details/123636811

版权

程序优化专栏收录该内容

8 篇文章 1 订阅

订阅专栏

在实际部署的时候，使用dataframe的计算效率明显低于numpy，因此在程序中大量运行时避免使用pandas.Series与pandas.DataFrame及频繁的构造，避免、替换的方法如下：

使用numpy.ndarry替换pandas.Series，在需要使用series的地方都用ndarry数组计算

使用滑动计算时，使用numpy的如下方法替换：

np.roll(array, 1)  # 向后搓一位（此时最后面的到最前面）
np.roll(array, -1)  # 向前搓一位（此时第一位到最末尾，第二位到第一位）

示例：计算增长率

array = np.array([2.3, 3.2, 2.8, 3.0, 4])
growth_rate = (array - np.roll(array, 1)) / np.roll(array, 1) * 100
growth_rate[0] = 0
print(growth_rate)

使用DataFrame的apply时，替换成for循环的ndarry计算，手动加一个多线程要远比使用pandas快
使用到DataFrame的多个维度的数据时，使用python dict替代，就是把字典key当成Dataframe的列名称，value当成列的值

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

呆萌的代Ma

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【Python】数据分析：结构化数分工具 Pandas | Series 与 DataFrame | 读取CSV文件数据

有道无术, 术尚可求。有术无道, 止于术。

12-03

3324

本章为基础前置，将介绍 Python 经典结构化分析工具 Pandas，掌握 Series 与 DataFrame 的用法，并学习如何使用 CSV 读取文件数据，为后续实战练习打下厚实的基础。

python列表替换元素_24_Pandas.DataFrame,Series元素值的替换（replace）

weixin_39852953的博客

11-24

2655

24_Pandas.DataFrame,Series元素值的替换（replace）要替换pandas.DataFrame，pandas.Series元素的值，请使用replace（）方法。这里，将描述以下内容。替换元素一次替换多个不同的元素在字典中指定在列表中指定注意点通过指定目标列进行替换用正则表达式替换替换缺失值NaN变更原始项目以下面的数据为例。一些元素的值已更改以作说明。import pa...

参与评论您还未登录，请先登录后发表或查看评论

python pandas DataFrame 数据替换

weixin_44493841的博客

12-29

4236

python pandas DataFrame 替换 import pandas as pd import numpy as np df1 = pd.DataFrame( { '日期': ['2021-7-2', '2021-8-2', '2021-9-2', '2021-10-2'], 'A': [1, 2, '', 4], 'B': [5, 6, '', 8], 'C': [9, 10, np.nan, 12],

pandas中Dataframe结构根据布尔条件选中Series并对其进行替换或赋值操作

weixin_40530363的博客

11-19

2896

df[‘Age’].replace(list(df[df[‘Age’]&amp;lt;=12][‘Age’]),‘child’,inplace=True)

python替换—Series.replace()与Series.str.replace()的区别及为何replace()无效的解决方法

sodaloveer的博客

08-25

2399

在Pandas中做数据处理，经常使用.replace()与.str.replace()方法来进行数据替换，本文介绍两种方法适用的对象，其中对于Series数据类型，它是一个由一维数组表示的DataFrame列，而.replace和.str.replace是Series对象的两种方法，虽然它们的名称相似，并且都用于替换Series的值，但实际上它们之间存在不同之外。

【python】(15)python的series进行值替换的4种代码实现方法

最新发布

qq_35559420的博客

03-27

1064

python的series进行值替换的4种代码实现方法：使用replace()方法、使用条件语句进行替换、使用map()方法、使用apply()方法。

python学习之路：pandas中的series和dataframe.xlsx

05-15

python学习之路：pandas中的series和dataframe.xlsx

Python数据分析：深入理解Pandas Series与DataFrame

"python数据分析之Pandas数据结构和操作" Pandas是Python中用于数据分析的核心库，它基于NumPy构建，提供了高效处理结构化数据的能力。Pandas的主要目标是使数据分析变得简单、直观，并且性能强大。它广泛应用于...

Python数据预处理实验：实验一练习Series和DataFrame的基本使用

m0_68526732的博客

01-20

532

摘要：本文是Python数据预处理实验的第一节内容：Series和DataFrame的基本使用

Pandas:Series和DataFrame删除指定轴上数据的方法

09-19

在Pandas中，Series和DataFrame是两种核心的数据结构。本篇文章将详细讲解如何在Series和DataFrame中删除指定轴上的数据。首先，我们来看Series和DataFrame的`drop`方法。`drop`方法用于删除指定轴上的数据，并...

利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

weixin_33727510的博客

08-07

545

一、reindex() 方法：重新索引针对 Series 重新索引指的是根据index参数重新进行排序。如果传入的索引值在数据里不存在，则不会报错，而是添加缺失值的新行。不想用缺失值，可以用 fill_value 参数指定填充值。例如： ...

python中DataFame一些性能优化的小小技巧

微信公众号（年更选手）：数据闲逛人 | Github开源项目：数分/数挖study路线 https://github.com/jc-dian/python_data_analysis

11-26

920

减少循环，提高运行效率，灵感来源，实习接的一些需求，看到运行时间预计要几小时那瞬间奔溃有点情景: 增加一列进行打标分几个类别套两个循环结果用isin()优化后 for j in tqdm(range(len(bcc_brand_list))): df.loc[df['brand_name'].isin(bcc_brand_list), 'category'] = 'BCC' for j in

【Python】Python常用的Series 和 Dataframe处理方法

02-28

1660

兵力相当，以正合，以奇胜

python数据分析-判断DataFrame的某列（Series），把满足条件的用某值替换

qq_40395868的博客

07-27

3029

问题：我现在需要判断一个DataFrame的列，并把满足条件的位置替换为我想要的值。方法一：数据展示：在修改的时候发现虽然打印出来显示的是NaN,但事实上并不是我们以为的np.nan或者None，用循环打印了一下数据类型显示如下： def change(x): if type(x) == np.float: return 0 else: return x a['a'] = a['a'].apply(lambda x: change(x)) 这样就修

pandas使用map函数、lambda、replace函数替换dataframe(series)日期数据列中的年份（year）信息（例如，统一将年份改为2050年、举一反三、修改月份、天信息类似）

data+scenario+science+insight

03-09

2699

pandas使用map函数、lambda、replace函数替换dataframe日期数据列中的年份（year）信息（例如，统一将年份改为2050年、举一反三、修改月份、天信息类似）

Pandas 中Series , Dataframe相关操作

m0_54361811的博客

04-19

1592

1.# 请将"_"处替换成能实现注释中功能的代码。 # 示例： # #设置列表lst中位置3的值为1 # lst_ # 根据注释中说明可知，此处"_"应替换成[3]=1,即有 # lst[3]=1 请先将下面的代码复制到答题框（注意添加缩进）： # 从pandas库导入Series,DataFrame from pandas import Series, DataFrame def fact(): answer =[] # 创建列表lst lst = [4, 7, -5, 3] # 使用列表list

python数值计算速度_快速提高Python数据分析速度的八个技巧

weixin_32270483的博客

02-21

541

点击上方“早起python”，关注早起和我一起，成为更好的自己今天整理了几个在使用python进行数据分析的常用小技巧、命令。记得搭配Pandas+Jupyter Notebook使用哦。 01使用PandasProfiling预览数据这个神器我们在之前的文章中就详细讲过，使用PandasProfiling可以在进行数据分析之前对数据进行快速预览，拿我们使用过很多次的...

dataframe遍历效率对比

ningyanggege的博客

04-13

2596

python

比起 Pandas, 你更需要 Polars：详细指南

一览无遗

12-28

5885

在数据分析领域，Python 由于其多功能性和广泛的库生态系统而成为一种流行的语言。数据处理和分析在提取见解和做出明智决策方面发挥着至关重要的作用。然而，随着数据集的规模和复杂性不断增长，对高性能解决方案的需求变得至关重要。有效地处理大型数据集需要能够提供快速计算和优化操作的工具。这就是 Polars 出现的原因。Polars 是一个强大的开源库，专为 Python 中的高性能数据操作和分析而设计。