错误
在使用pd.read_json()函数时出现ValueError: Unrecognized escape sequence when decoding 'string’错误
报错代码
df_data = pd.read_json(RAW_TRAIN_FILE_PATH, orient="records", lines=True)
报错
错误原因
原始文件文件格式是jsonlines而不是json,因此在读取的时候需要一条一条的读
解决方法
将代码修改为
data=[]
with open(RAW_TRAIN_FILE_PATH,'r',encoding='utf-8') as f:
for line in f:
data.append((json.loads(line)))
df_data=pd.DataFrame(data)