很多场景下使用pandas就能够胜任手上的excel处理任务,
之前写的用python操作具体到excel单元格的方法 参考:贺霆:python操作Excel实现自动化报表zhuanlan.zhihu.com
现在主要介绍使用pandas读取excel的几种常用场景:
一、常规读取
import pandas as pd
from pandas import DataFrame,Series
import os
os.chdir('./')
# 从指定文件路径读取excel表格
df = pd.read_excel('data.xlsx')
二、解决读取报错:UnicodeDecodeError
原因:pandas读取excel没有指定某列的数据类型
# 此处是因为excel中某列的数据类型没有指定,例如文本形式的身份证号码等等,解决方法:
df = pd.read_excel('data.xlsx',converters={'身份证号码':str,'手机号':str})
#这里的converters是一个dict,里面传入多对键值对可以同时指定读取多列的数据类型
#数据表格带中文,在读取时候增加encoding ='gbk'即可
df = pd.read_excel('data.xlsx',converters={'身份证号码':str,'手机号':str},encoding='gbk