pandas read_excel() 读取多文件同一字段数据类型不一致
问题
# 文件1
lawyer_fuwu1.xlsx 杜永胜 1.3706201110244824e+16 <class 'numpy.float64'>
# 文件2
lawyer_fuwu2.xlsx 徐祗向 13702202010173693 <class 'str'>
构成原因:
检查数据发现是源文件的数据本身存在差异
文件1都是数字而文件2中含有字符于是pandas解析时文件1返回了float类型文件2成了string
解决
运用read_excel()的converters属性将目标列的数据类型进行规范统一
datapath = os.path.dirname(getcwd()) + "/data/" + xlsxname
df = pd.read_excel(datapath, converters={'目标列列名': str})
# 问题解决
lawyer_fuwu1.xlsx 杜永胜 13706201110244823 <class 'str'>