在学习爬虫的时候 准备爬取天天基金网的数据
结果发现拿到了页面xpath解析出来却是"[]"
错误代码:
/html/body/div[2]/div[8]/div[3]/div[2]/div[3]/div/div[1]/table/tbody/tr[1]/td[1]
正确代码:
Jname = html.xpath(’/html/body/div[2]/div[8]/div[3]/div[2]/div[3]/div/div[1]/table/tr[1]/td[1]/text()’)
把tbody去掉就对了
原因是因为浏览器会对html文本进行一定的规范化
去掉xpath中的tbody即可
菜鸟踩坑
使用Xpath获取到了空列表
最新推荐文章于 2023-09-15 13:46:01 发布