- 博客(1)
- 收藏
- 关注
原创 如何使用selenium爬取某门户网站nba资讯
如何使用selenium爬取某门户网站nba资讯 由于现在网页多是采取动态加载的形式,如用普通爬取可能会无法获取相关信息,如在某门户网站,来到资讯页面,用调试手段尝试爬取发布时间的相关信息,爬取的结果很可能就是空的字符串或空列表,而selenium由于是模拟人浏览网页的第三方库,其page_source可以直观的获取你所见网页下的源代码信息,再利用lxml下的etree相关方法将其转成html元素,再用xpath解析就很简单了; 这里的思路是先到nba总的页面,从总的页面中获取新闻资讯板块的链接,然后根据链
2020-06-05 15:44:23
244
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人