前言
RPA 设计器版本: 2020.2
Python 读取三种不同存储格式 Excel 文件
Excel 文件的存储格式有多种, 有我们平常熟知的二进制格式,也有 HTML 格式,还有 XML 格式的等。
目前,小编接触到 RPA 项目的 Excel 文件格式主要是上述说的三种格式(二进制、HTML 、XML )
这里需要注意的是:RPA 设计器 2020.2 只支持二进制格式的 Excel 文件读取
Python 读取二进制类型的 Excel 文件并返回 DataFrame 对象
这里我直接将读取 Excel 的操作封装成函数放在 全局函数 使用,也可以使用 RPA 设计器自带的读取 Excel 组件。
def get_data_from_binary_excel(file_path):
"""
从 binary 二进制格式的 excel 中获取数据
:param file_path:
:return: DataFrame
"""
# 读取Excel 使用 pandas 读取二进制文件 excel
pd_df = pd.read_excel(io=file_path)
# 填充 NaN 将 nan 值用空字符串替换 df = rpa_pandas.fillna(df=pd_df)
df = pd_df.fillna('')
return df
Python 读取 HTML 类型的 Excel 文件并返回 DataFrame 对象
这里我直接将读取 Excel 的操作封装成函数放在 全局函数 中使用
def get_data_