解决的主要需求
专利信息来源:
知识产权数据库:点击跳转网站
这个网站原来叫“吉江数据”,最近更名为“知识产权数据库”。在该网站检索前需要注册账号并登录,并且该网站的反爬机制比较完善,如果各位需要爬取的单位地址比较多,建议各位事先多准备几个账号以备使用。
代码
# Author: LSY
import openpyxl
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
from bs4 import BeautifulSoup
import random
driver = webdriver.Chrome(executable_path='你的路径')
driver.get('https://www.iprdb.com/user/login.html')
wait = WebDriverWait(driver, 1)
account = driver.find_element_by_css_selector('#account')
account.send_keys("账号名/电话")
password = driver.find_element_by_css_selector('#password'