情况1:
当header列数小于数据实际列数时,pd.read_csv()读取后从右向左依次对应数据和header,数据左侧出现了以‘/’为分隔的堆积(xx、11111、114、49应分别是站名、站号、经度和纬度)。
情况2:
当header列数大于数据实际列数时,pd.read_csv()读取后从左向右依次对应数据和header,数据右侧以‘nan’补齐。
解决方法:
**方法1:**抛弃header,直接用usecol读取相关数据
x = pd.read_csv(file_path, sep=',', encoding='GB2312', usecols=[2]) #经度
y = pd.read_csv(file_path, sep=',', encoding='GB2312', usecols=[3]) #纬度
方法2: 用names参数,设定新header
def conver_titles(file_path): # 格式转换(系统生成的titles与数据不匹配)
global df
df0 = pd.read_csv(file_path, sep=',', encoding='GB2312')
df1 = pd.read_csv(file_path, sep=',', encoding='GB2312', header=1)
title_name = list(df0.columns)
title_name.extend(['Unnamed' + str(i) for i in range(df1.shape[1] - len(title_name))])
df = pd.read_csv(file_path, sep=',', encoding='GB2312', header=0, names=title_name)
return df