以某讯视频中的电影片库为例尝试selenium和BeautifulSoup结合获取动态数据。
网页必须通过滑动页面的方式才能加载数据,没有下一页等加载方式。滑动页面时style的两个属性也会不断地发生变化。不过通过观察每次加载385px后数据会更新。使用selenium加载数据,通过执行js以固定的高度滑动窗口,等待数据加载后再用BeautifulSoup获取数据。
from selenium import webdriver
from bs4 import BeautifulSoup
import time,csv
csv_file=open('腾讯电影库.csv','w',