python解析xml格式的excel_Python 读取二进制、HTML 、XML 格式存储的 Excel 文件

本文介绍了如何使用Python处理不同格式的Excel文件,包括通过pandas读取二进制和HTML格式的Excel,以及通过正则表达式解析XML格式的Excel。提供了相应函数实现,如`get_data_from_binary_excel`、`get_data_from_html_excel`和`get_data_from_xml_excel`。
摘要由CSDN通过智能技术生成

前言

RPA 设计器版本: 2020.2

Python 读取三种不同存储格式 Excel 文件

Excel 文件的存储格式有多种, 有我们平常熟知的二进制格式,也有 HTML 格式,还有 XML 格式的等。

目前,小编接触到 RPA 项目的 Excel 文件格式主要是上述说的三种格式(二进制、HTML 、XML )

这里需要注意的是:RPA 设计器 2020.2 只支持二进制格式的 Excel 文件读取

Python 读取二进制类型的 Excel 文件并返回 DataFrame 对象

这里我直接将读取 Excel 的操作封装成函数放在 全局函数 使用,也可以使用 RPA 设计器自带的读取 Excel 组件。

def get_data_from_binary_excel(file_path):

"""

从 binary 二进制格式的 excel 中获取数据

:param file_path:

:return: DataFrame

"""

# 读取Excel 使用 pandas 读取二进制文件 excel

pd_df = pd.read_excel(io=file_path)

# 填充 NaN 将 nan 值用空字符串替换 df = rpa_pandas.fillna(df=pd_df)

df = pd_df.fillna('')

return df

Python 读取 HTML 类型的 Excel 文件并返回 DataFrame 对象

这里我直接将读取 Excel 的操作封装成函数放在 全局函数 中使用

def get_data_

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值