使用pandas提取HTML文件中的表格数据

使用 pandas 提取 HTML 文件中的 表格 数据,并存储为 .txt 文件

1、安装 pandas库lxml库

pip3 install pandas
pip3 install lxml

安装 lxml库 的原因
使pandas库,在使用read_html() 函数读取html文件时,能够正常工作。
注意点:只用将 lxml 库,安装即可,不用将包导入在项目中。

2、示例

import pandas as pd
url = '你的html文件路径'
tables = read_html(url)
table = tables[n] # html 文件中的第n-1个表格数据
table = table.round(3) # 使数据四舍五入保留小数点后3位
table.to_csv('test.txt', index=False, sep=',')
# index=False -----> 用于设置所存数据是否保留行号
# sep=','     -----> 用于设置参数之间的分隔符
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值