在研究代码时发现,某一个算法只需用到数据集中某几列中,如何将所需要的数据从完整数据集中提取出来呢?
step 1、把下载好的数据集的CSV模式上传,后面两行print是为了确定上传无误
dir = 'E:/PHD/pythonProject/CNN-LSTMtestProjrct/datacsv'
listdir = os.listdir(dir)
print(listdir)
print("The number of dataset :", len(listdir))
step 2、选出你需要的两列代码,这里我选的是cycle、capacity和SOH
vec = df[['cycle', 'capacity', 'SOH']]
step 3、可以先输出完整数据集看一下
data = pd.read_csv('refined_dataset/B05_discharge_soh.csv')
df = pd.DataFrame(data)
df
输出如下:
step 4、提取目标数据,随后输出显示:
globals()['data_{}'.format(num[i])] = vec
data_B05
结果如下: