爬取前程无忧招聘网站十万条招聘信息并存入数据库
1.首先导入本次需要用到的包
import json #网页可能使用json写的数据
import re #正则表达式
import pymysql #导入pymysql等下需要连接数据库存储爬虫数据
import requests #导入请求包,获取网页
from bs4 import BeautifulSoup #网页源码解析器
2.进行爬虫
#数据库存储的操作可以在爬虫之后进行(可先看第二部分爬虫)
cur = pymysql.connect(user='',
password="",
host='',
database='')
#连接数据库,ctrl+p可以查看需要的参数。
def save(update_time, positon_name, salary, job, company_type, company_name, company_size, attribute, workarea):#定义一个save函数传入所需参数
cursor = cur.cursor()#游标
sql = f"insert into lhlqianchengwuyou (update_time,positon_name, salary,job, company_type, company_na