小编因论文需要海关进口数据,利用火狐浏览器+Selenium编写了一个爬取海关数据的程序。网址上的数据原本是可以直接导出的,但是导出2019年前(包括2019年)的数据会受到服务器限制,只能导出低于1万条的数据。因此,写了一个爬虫程序对2019年海关所有商品进出口的数据进行爬取,在爬虫过程中频繁出现错误:selenium.common.exceptions.NoSuchWindowException: Message: Browsing context has been discarded。在网上查询相关资料未有解决该问题的方法,自己探索了很久,终于搞明白了为什么出现这个问题。
出现该问题的根本原因是网站上的Frame框架(frame1,frame2)中有几个并联的子框架,当我使用bro.swich_to.frame("frame1"),在frame1框架中进行元素定位,定位完成后没有使用bro.switch_to.parent_fram()回到Frame中,运行就会出现这种错误,所以大家一定要仔细检查代码是不是有遗漏bro.switch_to.parent_fram()。
按理来说,一般没有定位到Frame,使用定位元素的语句应该出现错误:未能找到elements,小编也是头一次碰到因未定位到Frame出现错误:Browsing context has been discarded。
希望小编的这次学习笔记能为大家解决同样的问题。