我取消了一些网站和它的动态工作。我要去一个网站的所有页面,同时我要所有页面的所有页面源数据列表。
这是我的代码移动到所有的页面并获取它们的页面源代码。但函数末尾没有打印或返回。
我是为其他网站做的,但不是这里。
请帮我摆脱困境。
谢谢你def get_html(driver):
output = []
keep_going = True
while keep_going:
# Pull page HTML
try:
output.append(driver.page_source)
except TimeoutException:
pass
try:
# Check to see if a "next page" link exists
keep_going = driver.find_element_by_class_name(
'next ').is_displayed()
except NoSuchElementException:
keep_going = False
if keep_going == True:
try:
driver.wait.until(EC.element_to_be_clickable(
(By.CLASS_NAME, 'next '))).click()
time.sleep(3)
except TimeoutException:
keep_going = False
else:
keep_going = False
print(str(len(output)))
return (output)
raw_data = get_html(driver)
print(str(len(raw_data)) listing found")
这是我得到的错误输出。在
^{pr2}$