使用
pandas
提取 HTML 文件中的表格
数据,并存储为.txt
文件
1、安装 pandas库
和 lxml库
pip3 install pandas
pip3 install lxml
安装
lxml库
的原因
使pandas库,在使用read_html()
函数读取html文件时,能够正常工作。
注意点:只用将lxml 库
,安装即可,不用将包导入在项目中。
2、示例
import pandas as pd
url = '你的html文件路径'
tables = read_html(url)
table = tables[n] # html 文件中的第n-1个表格数据
table = table.round(3) # 使数据四舍五入保留小数点后3位
table.to_csv('test.txt', index=False, sep=',')
# index=False -----> 用于设置所存数据是否保留行号
# sep=',' -----> 用于设置参数之间的分隔符