1、读取execl的多个sheet
# 读取excel 的内容为字典形式,key 为sheet 名,后面参数sheet_name指定时,只读取指定sheet内容,header为空,不把sheet的第一行作为列的index,
excel_sheets_dict = pd.read_excel(data_path,sheet_name=None, header=None)
例子:
0 1 2 3 4 ... 32 33 34 35 36
0 False True False False False ... False False False False False
1 False True True True False ... False False False False False
2 False True True False False ... False False False False False
3 False True True True False ... False False False False False
4 False True True True False ... False False False False False
.. ... ... ... ... ... ... ... ... ... ... ...
58 False True True True True ... True True True True True
59 False True True True True ... True True True True False
60 False True True True True ... True True True True False
61 False True True True True ... True True True True False
62 False False False True True ... True True True False False
2、获取excel的列名称
Sheets_columns = excel_sheets_dict["sheet_name1"].columns
3、获取每一位置的内容
Content_1_1 = excel_sheets_dict["sheet_name1"][1][1]
4、获取某个范围的内容(#读取第一行第二行的title以及data列的值,这里需要嵌套列表)
data= excel_sheets_dict["sheet_name1"].ix[[1,2],['title','data']].values
5、判断每个位置是否为空
方法一:excel_sheets_dict["sheet_name1"].isna()
方法二:excel_sheets_dict["sheet_name1"] == excel_sheets_dict["sheet_name1"]
6、判断某一列是否存在某一个值
pd_data = excel_sheets_dict["sheet_name1"]
pd_pos = pd_data.loc[(pd_data[1]=="need_phrase")]