分享一个常用的pandas处理数据的脚本。
import numpy as np
import pandas as pd
df = pd.read_excel(".xlsx",usecols=[0])#skiprows=2#读取表格的一列
df_arr = np.asarray(df.stack())#Dataframe类型堆叠变成Series类型再转成numpy数组
cls_list = df_arr.tolist()#转list
print(cls_list)
pd.read_excel用来读取表格中的某一列,usecols这个参数就用来设置所需要读取列的索引,skiprows这个参数可以让你从某列的某一行开始读取,读取到信息是Dataframe类型
利用stack()函数将格式改变最后在转化成numpy数组
最后通过tolist转化成列表
该脚本使用pandas的read_excel函数读取.xlsx文件中的一列,通过usecols参数指定列索引。然后运用stack方法将Dataframe转换为Series,再转为numpy数组。最后,数据被转换为列表格式以便进一步处理。
7890

被折叠的 条评论
为什么被折叠?



