在我们用pandas读取.csv文件出现“UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc3 in position 0: invalid continuation byte”等原因是,是因为文件编码格式的问题导致pandas读写错误,例如:
import numpy as np
import matplotlib.pyplot as plt
import sklearn
from sklearn.linear_model import LinearRegression
import pandas as pd
data = pd.read_csv('./text.csv')
data.head()
print(data.head)
现在我们直接在pd.read_csv的括号中进行更改,添加如下代码:
data = pd.read_csv('./text.csv', encoding="gbk", header=0, index_col=0)
看看结果:
问题就得到解决。