意义:用selenium访问浏览器时,该网站可能只给你上半部分的数据,爬虫也只能获取这些数据了,你需要滑动到下面,它才给你返回下半部分的网页数据。这样就可以获取到该页面的全部数据。
scrollTop=8000的8000是可以自己调整,是指明要滑动的距离(单位:像素) 。
在self.dri.get(
‘https://search.jd.com/Search?keyword=华为手机&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&bs=1’) 后面添加下面语句。
js = 'var q=document.documentElement.scrollTop=8000'
self.dri.execute_script(js)
time.sleep(3)
往下再写self.get_page_from_url()等方法即可,网速慢的话time.sleep()时间还得延长超过3秒哦。
管用的希望能给我点赞或收藏哦。