.csv文件读取总是报各种错。df = pd.read_csv(path file, sep='None') ,好不容易读取出来,又不是我想要的形式。
df = pd.read_csv(path1file, sep='None')
print(df.shape, df.columns)
(101, 1) Index(['col1,col2,col3,col4,col5,col6,col7'], dtype='object')
故重写数据,当然我是因为时间紧,数据量小的情形。若数据量大,肯定是想办法正确读出数据来。
# 将.csv行数据,按逗号分隔,转存为dataframe格式数据
path1 = "E:\\data\\"
path2 = "E:\\newdata\\"
dfs = []
for file in os.listdir(path1):
print(file)
with open(path1 + file, 'r') as fl:
data = [line.strip('\n').split(',') for line in fl.readlines()]
data1 = np.array(data[1:])
df = DataFrame(data1,columns=data[0])
print(df.head())
df.to_csv(path2 + file, encoding='utf-8-sig', index=None)
根据以上代码重写数据,得到我想要的数据格式,并存储到文件,方便后续直接读取。