Python 爬虫抓取拉勾网职位数据，并存入CSV文件

最新推荐文章于 2024-04-24 22:05:32 发布

老徐WEB

最新推荐文章于 2024-04-24 22:05:32 发布

阅读量2.6k

点赞数 1

分类专栏： python 文章标签： Python 爬虫拉勾 pandas urllib

本文链接：https://blog.csdn.net/uvyoaa/article/details/80575002

版权

这次把采集的数据存入CSV文件，之前写过把数据存入MySQL数据库的文章，请点击。一些准备工作，比如职位接口、伪装浏览器及传递参数等信息也请在之前的文章里查看，此处不在重述了。

完整代码如下：

 # -*- coding: utf-8 -*- 
import pandas as pd
#from bs4 import BeautifulSoup
import urllib.request as req
import urllib.parse
import re
import json
import sys
import time
import random

print(sys.getdefaultencoding())

class LagouCrawler:
    
    def __init__(self,location_word,position_word,pages):
        self.location_word = location_word
        self.position_word = position_word
        self.pages = pages
        self.location_url = 'https://www.lagou.com/jobs/positionAjax.json?city=%s&needAddtionalResult=false'#positionAjax.json?city=北京&needAddtionalResult=false

    def request_method(self,params):
        #伪装浏览器&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

老徐WEB

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Python 爬虫抓取拉勾网职位数据，并存入CSV文件

这次把采集的数据存入CSV文件，之前写过把数据存入MySQL数据库的文章，请点击。一些准备工作，比如职位接口、伪装浏览器及传递参数等信息也请在之前的文章里查看，此处不在重述了。完整代码如下： # -*- coding: utf-8 -*- import pandas as pd#from bs4 import BeautifulSoupimport urllib.request as ...
复制链接

扫一扫