Python爬虫大作业+数据可视化分析（抓取python职位）

最新推荐文章于 2024-06-17 15:10:50 发布

每日一小知识

最新推荐文章于 2024-06-17 15:10:50 发布

阅读量3.8k

点赞数 11

分类专栏：面试学习路线阿里巴巴文章标签： android 前端后端

本文链接：https://blog.csdn.net/m0_54861649/article/details/126113938

版权

一、获取数据

运用正则表达式，找到相对应的数据，然后对数据进行清洗，最后保存数据，保存为excel文件和保存到数据库中。（这里用的是sqlite数据库）

1.导入相关库

import re  # 正则表达式，进行文字匹配
from urllib.request import Request
from urllib.request import urlopen  # 制定URL，获取网页数据
from urllib.error import URLError as error
import json
import xlwt
import sqlite3

2、获取网页信息

爬取到的信息是很多，需要用正则表达式进行匹配，一个工作岗位有：8个属性，我只爬取职位名称、公司名称、公司链接、工资、工作地点、是否是实习、员工待遇。

def main():
    baseurl = "https://search.51job.com/list/000000,000000,0000,00,9,99,python,2,{}.html?lang=c&po

最低0.47元/天解锁文章

每日一小知识

关注

11
点赞
踩
104

收藏

觉得还不错? 一键收藏
6
评论
Python爬虫大作业+数据可视化分析（抓取python职位）

第一次写项目总结，笔记还不太完善，只是做了一个很简单的框架，简单记录一下！(需要完整项目工程文件，可以私信或留言)先自我介绍一下，小编13年上师交大毕业，曾经在小公司待过，去过华为OPPO等大厂，18年进入阿里，直到现在。深知大多数初中级java工程师，想要升技能，往往是需要自己摸索成长或是报班学习，但对于培训机构动则近万元的学费，着实压力不小。自己不成体系的自学效率很低又漫长，而且容易碰到天花板技术停止不前。httpshttpshttpshttpshttpshttpshttps。...
复制链接

扫一扫