#更新:
发现diff函数可以完全替代for语句,这样既减少了时间有减少了程序的复杂性!!大概操作就是
df[‘col_name’].diff(period=) period决定是第几期减第几期
#写这个的初衷是想在数据量很大的时候,在对dataframe里面的数据按照某规律进行排序后,通过循环计算相邻两行之间的差距非常耗时的问题。
在写循环的时候,希望大家考虑是不是可以使用矩阵运算来替代循环,节约程序运行时间。这个真的非常有用,特别是对于数据量特别大的情况下,使用for循环的时间远远超过使用矩阵运算的时间。
#先导包
import time
import numpy as np
import pandas as pd
#构造一个dataframe
L = pd.DataFrame({
0:[i for i in np.random.randint(1,10000,20000)]})
L.head()
输出结果如下:
start = time.time(