#1 读取表格
df = pd.read_excel("目标文件路径", skiprows=要跳过的行数)
┗━━━━━━━┳━━━━━━━┛
指定读取表格时要跳过前面空行的行数
#2 筛选某列不是空值的所有行
df.loc[ df["某列"].notnull(), : ]
┗━━━━━━━┳━━━━━━━┛ ↓
筛选某列不为空值的所有行 筛选行后选取所有列
#3 删掉整个的空行或空列
df.dropna(axis = 0, how='all', inplace=True)
┗━━┳━━┛
删除空行用axis=1或"columns",删除空列用axis=1或"columns"
#4 用0填充空值
df.fillna({"某列名":0}) #采用字典方式 用0填充某列的空值
或用.loc选取填充,与之等效:
df.loc[:, "B列"] = df["B列"].fillna(0)
#5 用前值或后值填充当前空值
df.loc[:, "B列"] = df["B列"].fillna(method="ffill") #"ffill":非空前值,"bfill":非空后值
#6 保存处理后的数据
df.to_excel("路径文件.xls", index=False)