问题:
有一个较大的表格数据存在了html中,打算用read_html直接取出来这部分数据,但后来发现read_html读取的数据不完整,后来检查html的table都没有任何问题
解决办法:
pd.read_html的默认解析器为 'lxml' ,添加参数flavor='bs4'便可解决
在尝试使用`pd.read_html`从HTML文件中提取表格数据时遇到不完整的问题,原来是默认解析器'lxml'导致的。通过设置参数`flavor='bs4'`,成功解决了数据读取不全的故障,确保完整获取了表格内容。
问题:
有一个较大的表格数据存在了html中,打算用read_html直接取出来这部分数据,但后来发现read_html读取的数据不完整,后来检查html的table都没有任何问题
解决办法:
pd.read_html的默认解析器为 'lxml' ,添加参数flavor='bs4'便可解决
3241
3360
485
1万+

被折叠的 条评论
为什么被折叠?
