Python爬取51jobs之环境准备(1)

NO 1,明确目标

目的:Python爬取前程无忧网招聘关于在杭州测试工程师的招聘信息(其中包括招聘公司,招聘信息,月薪范围),并保存在mysql数据库中

分解目的:

1,创建一个FindJobs类:爬取信息

2,创建一个Data_Transport类:将爬取信息保存到mysql

继续分解

FindJobs类下面的方法:

1,创建一个get_webpage()方法:爬取前程无忧网,获取在杭州测试工程师各招聘网站信息(工具:selenium+chrome);

2,创建一个data_cleaning()方法:爬取get_webpage()获取的网站,清洗数据,返回招聘公司,招聘信息,月薪范围信息(工具:bs4+正则+requests)。

NO 2,环境准备

1,selenium+chrome

不同的谷歌浏览器对应不同的谷歌驱动版本,firefox浏览器驱动为geckodriver.exe。

下载完成后,如果方便的话直接将谷歌驱动放入你python.exe同一目录下(Python环境变量目录)

百度盘资源: https://pan.baidu.com/s/1-6hjqstNQ6Fek4hN1vukrA

更多selenium入门学习,参考Anthony_tester的博客,很详细,值得一看。

2,Python导入模块

from selenium import webdriver
import time
import requests
import re
from bs4 import BeautifulSoup
import pymysql

如果在终端的话,直接pip install 就可以了,如:pip install selenium

如果你使用的是pycharm

1,点击左上方File

2,点击setting,找到你的项目,然后点击“+”号就可以

3,在搜索框输入你要下载模块,比如selenium

点击install Package就开始下载了

更多bs4资料:https://www.cnblogs.com/09120912zhang/p/7624643.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值