Python beautifulsoup+requets爬虫示例

最新推荐文章于 2024-03-29 00:20:16 发布

想做架构师

最新推荐文章于 2024-03-29 00:20:16 发布

阅读量650

点赞数

分类专栏：应届生一年后毕业找工作文章标签： Python requests beautifulsoup

本文链接：https://blog.csdn.net/qq_39184715/article/details/82025868

版权

本文提供了一个使用Python的requests和beautifulsoup库进行网页爬虫的实例，展示了如何爬取中华英才网的大数据工程师职位信息，并将数据存入数据库。后续会涉及Selenium、pyquery、Scrapy、Ajax、动态代理和分布式Scrapy等更复杂的爬虫技术。

摘要由CSDN通过智能技术生成

一个简单的小python爬虫，因为时间原因，没有做翻页，谅解。

写的不好，希望大家互相进步，一起成长

后续将会更新Selenium,pyquery，scrapy，Ajax，动态代理，分布式scrapy等一些相关爬虫博客，请多关注

爬取中华英才网特定地区的大数据工程师招聘信息并插入到数据库

from bs4 import BeautifulSoup

import requests
import pymysql

page = 'http://www.chinahr.com/sou/?city=34%2C398%3B36%2C400%3B37%2C401%3B25%2C292%3B25%2C291&keyword=%E5%A4%A7%E6%95%B0%E6%8D%AE'
respone = requests.get(page)
respone.encoding = 'utf-8'

soup = BeautifulSoup(respone.text, 'lxml')
urlResult = soup.select('.jobList .l1 .e1 a')
dateResult = soup.select('.jobList .l1 .e2')
company = soup.select('.jobList .l1 span a')
addrAndNeeds = soup.select('.jobList .l2 .e1')
wagesResult = soup.select('.jobList .l2 .e2')
for i in company:
    if i.string == None:
        company.remove(i)
db = pymysql.c

最低0.47元/天解锁文章

想做架构师

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python beautifulsoup+requets爬虫示例

一个简单的小python爬虫，因为时间原因，没有做翻页，谅解。写的不好，希望大家互相进步，一起成长后续将会更新Selenium,pyquery，scrapy，Ajax，动态代理，分布式scrapy等一些相关爬虫博客，请多关注爬取中华英才网特定地区的大数据工程师招聘信息并插入到数据库from bs4 import BeautifulSoupimport requestsimp...
复制链接

扫一扫

专栏目录