初学者瞎写的一个爬虫小程序

学习python三个月,渐渐的的也开始了爬虫之旅,根据某本书的指导,开始想写一个通用的爬虫小程序,希望有大神能指点一下。

import datetime
import time
from selenium import webdriver
import re


class MyCommonSpider:
    def __init__(self):
        pass

使用了selenium进行模拟鼠键操作,目标是爬取51job上的职位信息

    def get_data(self, url, send_keys='', pages_you_want=1, search_field='', search_button='', page_field='',
                 next_button=''):
        '''
        获取页面数据的函数
        :param url: 获取页面的地址
        :param send_keys: 搜索框中的搜索关键词
        :param pages_you_want: 你需要爬取的总页数
        :param search_field: 搜索框的xPath
        :param search_button: 搜索按钮的xPath
        :param page_field:  页面填写框
        :param next_button: 下一页按钮
        :return: 返回存储所有页面数据的list[str]
        '''
        browser = webdriver.Chrome()  # 获取一个浏览器对象 使用谷歌浏览器
        browser.maximize_window()  # 整个页面显示
        browser.get(url)  # 获取页面
        time.sleep(3)
        if send_keys != '' and search_field != '':
            browser.find_element_by_xpath(search_field).clear()  # 清空搜索框数据
            browser.find_element_by_xpath(search_field).send_keys(send_keys)  # 写入搜索关键字
        if search_button != '':
            browser.find_element_by_xpath(search_button).clic
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值