datatable中并没有直接可以使用的函数.
思路如下:
1.备份该列到isFraud.csv
2.删除fraud_delte_seven.csv中的isFraud列
3.依然使用datatable读取isFraud.csv的内容,然后在尾部追加isFraud列
代码如下:
import datatable as dt
folder_path = './'
fraud_data= dt.fread(f'{folder_path}fraud_delte_seven.csv')#读取文件
#------------------备份要移动的列到外面-----------------
fraud_data["isFraud"].to_csv("isFraud.csv")
#-----------删除该列---------------
del fraud_data[:,'isFraud']
#-----------追加该列---------------
append_data= dt.fread(f'{folder_path}isFraud.csv')
fraud_data.cbind(append_data)
#---------写入到新的文件---------------
fraud_data.to_csv("fraud_isFraud_moved.csv")
运行结果:
100% |██████████████████████████████████████████████████| Reading data
100% |██████████████████████████████████████████████████| Writing CSV
real 0m3.675s
user 0m20.930s
sys 0m2.716s
性能:
59w的数据集,处理时间3s内
datatable的官方文档
https://datatable.readthedocs.io/en/latest/using-datatable.html