UiPath之获取邮件信息中的table并存入表格（补充，使用Python爬虫爬取）

最新推荐文章于 2024-06-27 21:42:48 发布

欧尚吖

最新推荐文章于 2024-06-27 21:42:48 发布

阅读量565

点赞数

分类专栏： UiPath 文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/qq_52277417/article/details/127987215

版权

UiPath 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

python文件，我们使用这个包来处理python脚本。

这里的包没有的话请下载

pip install bs4

pip install panda

pip install lxml

from bs4 import BeautifulSoup
import pandas as pd
from lxml import etree

def ExcelFromHTML(path):
    soup=BeautifulSoup(open(path,encoding='utf-8'),features='lxml')  #features值可为lxml
    tables = soup.find_all('table')
    index = 0
    for table in tables:
        index=index+1
        df = pd.read_html(table.prettify(), header=0)[0]  # prettify():页面美化（整理成有格式的） #myTable04
        df.to_excel("爬取表.xlsx",sheet_name="信息表{}".format(index) ,index=False,encoding="utf-8")

拉取活动Python Scope，并设置属性：

Library path：安装py的目录

Target：电脑操作系统位数

Version：电脑安装Python版本