使用pandas读取excel时,经常会遇到空值,这时如果读取的是整数列,便会出现如下情况:
import pandas as pd
>>> df = pd.read_excel(r'D:/myExcel/1.xlsx')
>>> df
name score
0 lc 78.0
1 la 31.0
2 lb 79.0
3 ld 78.0
4 le 90.0
5 ll NaN
score列需要的是整数,但是读取出来却变成了小数列。
这时需要在读取时指定dtype类型:
>>> df = pd.read_excel(r'D:/myExcel/1.xlsx', dtype={'score':'Int64'})
>>> df
name score
0 lc 78
1 la 31
2 lb 79
3 ld 78
4 le 90
5 ll NaN
这时,就会方便很多。
哈哈,欢迎关注python小工具,一起学习python和pandas