仅作为记录,大佬请跳过。
博主自制一个.csv的数据集(数据集来源—传送门)
在使用下面代码打开时,
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.style.use('seaborn-whitegrid')
plt.rc('font', **{'family': 'Microsoft YaHei, SimHei'})
# 设置中文字体的支持
df = pd.read_csv('loan_apply.csv')
print(df)
却出现pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields
的错误
解决:
不能直接修改后缀名,而是通过另存为从excel得到.csv
参考大佬博主文章—传送门
接着运行上述代码,又出现如下错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb8 in position 2: invalid start byte
解决:
在打开文件的代码里加入encoding=‘gbk’
即将代码改为:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.style.use('seaborn-whitegrid')
plt.rc('font', **{'family': 'Microsoft YaHei, SimHei'})
# 设置中文字体的支持
df = pd.read_csv('loan_apply.csv',encoding='gbk')
print(df)
参考—传送门
至此,python的pandas打开了自制的.csv文件