前言
学习python的就业前景怎么样呢,不妨我们用python来采集一些招聘网的数据信息,看看行情怎么样
前期准备
-
模块使用
requests
pandas
pyecharts -
开发环境
版 本: python3.8
编辑器: pycharm
主要代码
import requests # 发送请求 第三方模块
import re # 正则模块 内置模块
import json
import csv
1. 发送请求
response = requests.get(url=url, headers=headers)
2. 获取数据
<Response [200]>: 请求成功
html_data = response.text
3. 解析数据
# a. 从<script id="__NEXT_DATA__" type="application/json">开始 到</script>结束
# 中间的所有内容先取出来
# (.*?): 匹配任意内容
# <script id="__NEXT_DATA__" type="application/json">(.*?)</script>
json_str = re.findall('<script id="__NEXT_DATA__" type="appli