python爬取智联招聘_【原创源码】python 爬取智联招聘

[Python] 纯文本查看 复制代码from selenium import webdriver

from selenium.webdriver.chrome.options import Options

from selenium.webdriver.common.keys import Keys

from pyquery import PyQuery as pq

import time

class ZhiLian:

def __init__(self):

# 设置 chrome 无界面化模式

self.chrome_options = Options()

self.chrome_options.add_argument('--headless')

self.chrome_options.add_argument('--disable-gpu')

self.driver = webdriver.Chrome(chrome_options=self.chrome_options)

def get_url(self, search='python'):

"""

获取搜索职位的url, demo里面默认搜索python

:param search:

:return:

"""

self.driver.get("https://www.zhaopin.com/")

element = self.driver.find_element_by_class_name("zp-search__input")

element.send_keys(f"{search}")

element.send_keys(Keys.ENTER)

# 切换窗口

self.driver.switch_to.window(self.driver.window_handles[1])

# 等待js渲染完成后,在获取html

time.sleep(4)

html = self.driver.find_element_by_xpath("//*").get_attribute("outerHTML")

return html

def data_processing(self):

"""

处理数据

:return:

"""

html = self.get_url()

doc = pq(html)

contents = doc(".contentpile__content__wrapper")

for content in contents.items():

jobname = content(".contentpile__content__wrapper__item__info__box__jobname__title").text()

companyname = content(".contentpile__content__wrapper__item__info__box__cname").text()

saray = content(".contentpile__content__wrapper__item__info__box__job__saray").text()

demand = content(".contentpile__content__wrapper__item__info__box__job__demand").text()

yield jobname, companyname, saray, ",".join(demand.split("\n"))

datas = ZhiLian().data_processing()

for data in datas:

print(data)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python是非常流行的数据分析和爬虫工具。借助Python爬取招聘网站源码和数据分析是一项非常常见的任务。Python有许多第三方库和工具可供使用,使得编写Web爬虫和抓取网页数据变得容易。 要开始爬取招聘网站,首先要选择一个目标网站并了解其结构和内容。一旦你确定了要爬取的网站,你可以使用Python中的Requests和BeautifulSoup库来下载并分析网页源码。BeautifulSoup是一个Python库,可以从HTML和XML文档中提取数据。使用BeautifulSoup可以轻松地分析HTML页面并提取所需的信息。Python的Requests库使得从网站抓取数据非常容易。使用Requests库,您可以轻松地下载HTML页面以及其他网站资源,例如图像。 当你获得了网站的源代码并从中提取所需的数据,你可以使用Pandas数据分析库来对这些数据进行分析和操作。Pandas可以轻松地从各种数据源中读取和处理数据,而且是Python数据科学领域中最流行的库之一。您可以使用Pandas来对数据进行切片,切块,过滤和排序,还可以使用广泛的数据建模和分析工具进行进一步的探索。 总的来说,使用Python对招聘网站进行数据爬取和分析是一项非常有趣和有用的任务。Python的第三方库和工具提供了强大且易于使用的方法来从HTML源代码中提取所需的数据,并使用Pandas进行分析和建模,使得这项任务变得更加容易和有用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值