示例网站: http://cov-glue-viz.cvr.gla.ac.uk/mutations.php 操作示例(先打开浏览器的调试开关,以chrome为例):

代码里边的参数跟上图中,右下角红色方框保持一致,
代码:
import requests
url="http://cov-glue-viz.cvr.gla.ac.uk/mutations.php"
params = {
"lineageList": "All",
"orfList": "All",
"mutTypeList": "nonsyn",
"minCountList": 1,
"minPropList": 1.0E-6,
"refreshTable": "Refresh Table"
}
html = requests.post(url, data=params)
htmltext = html.text
tabletext = htmltext.replace("</tr>", "\n")
file = open("test.txt", "w")
file.write(tabletext)
file.close()
:
该博客展示了如何使用Python的requests库从指定网址抓取表格数据。通过设置特定的参数,如选择所有ORF和非同义突变类型,并设定最小计数和比例,然后发送POST请求获取HTML内容。进一步处理HTML文本,将表格行转换为新的行终止符并保存到文本文件中。
899

被折叠的 条评论
为什么被折叠?



