使用pandas提取HTML文件中的表格数据

最新推荐文章于 2024-01-18 11:55:33 发布

天空蛋

最新推荐文章于 2024-01-18 11:55:33 发布

阅读量357

点赞数

分类专栏： python 文章标签： pandas html

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FourJin/article/details/132338167

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

使用 pandas 提取 HTML 文件中的 表格 数据，并存储为 .txt 文件

1、安装 pandas库 和 lxml库

pip3 install pandas
pip3 install lxml

安装 lxml库 的原因
使pandas库，在使用read_html() 函数读取html文件时，能够正常工作。
注意点：只用将 lxml 库，安装即可，不用将包导入在项目中。

2、示例

import pandas as pd
url = '你的html文件路径'
tables = read_html(url)
table = tables[n] # html 文件中的第n-1个表格数据
table = table.round(3) # 使数据四舍五入保留小数点后3位
table.to_csv('test.txt', index=False, sep=',')
# index=False -----> 用于设置所存数据是否保留行号
# sep=','     -----> 用于设置参数之间的分隔符

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
使用pandas提取HTML文件中的表格数据

python使用pandas提取html表格数据，并保存在txt文件中
复制链接

扫一扫

专栏目录

天空蛋 CSDN认证博客专家 CSDN认证企业博客

码龄4年

17: 原创

142万+: 周排名

28万+: 总排名

6142: 访问

: 等级

188: 积分

1: 粉丝

12: 获赞

8: 评论

27: 收藏

私信

关注

热门文章

分类专栏

Qt 9篇
C++ 3篇
前端 3篇
python 1篇

最新评论

Qt5.12+OpenCV4.7.0+Contrib4.7.0编译报错解决方法
lmk2015: 这个方法可以具体请教下吗？搞了两天实在不想再换一个opencv版本
Qt5.12+OpenCV4.7.0+Contrib4.7.0编译报错解决方法
fake202: 把gcc版本升到7.4以上也行
Qt5.12+OpenCV4.7.0+Contrib4.7.0编译报错解决方法
weixin_45995690: 没有好的解决方法吗，这样装起来看不到DNN
【Qt】Qt读取/修改Excel文件
m0_68160184: workbook 显示does not name a type是怎么回事？
C语言学习记录
CSDN-Ada助手: 恭喜您撰写了第14篇博客，题为“C语言学习记录”。您的坚持和努力让我非常钦佩！在这篇博客中，您记录了自己的学习过程，这对其他学习C语言的人来说是一份宝贵的参考资料。不过，如果我可以提供一个建议的话，希望您能在接下来的创作中，进一步扩展您的主题，例如分享一些实用的C语言编程技巧或者解决常见问题的经验。这样可以更好地帮助读者提升他们的编程能力。期待您的下一篇博客，再次感谢您的分享！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。