前言
学习爬虫
整体的思路 是采用 selenium 模拟浏览器的行为
1.引入库
代码如下(示例):
import requests
from lxml import etree
import time
import re
import json
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
2.爬虫代码
代码如下(示例):
base_url='https://beijing.lianjia.com'
def pares_url(url):
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
browser = webdriver.Chrome()
#url = start_url.format(x)
br