嗨喽~大家好呀,这里是魔王呐 ❤ ~!
python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取
环境使用:
-
Python 3.10 解释器
-
Pycharm 编辑器
模块使用:
-
requests
-
re
-
csv
-
pandas
爬虫实现第一步:
一. 抓包分析
-
找到对应数据链接地址
-
套用代码:
-
修改链接
-
请求方式 (大部分get)
-
请求头模拟伪装 (复制)
-
根据响应返回的数据, 选择对应数据获取方式
-
文字: 评论 / 弹幕 / 小说内容 / 房源数据 / 电商平台数据
保存: txt 表格文件中 (csv / Excel)
-
-
二. 代码实现步骤
-
发送请求
-
获取数据
-
解析数据
-
保存数据
代码
# 导入数据请求模块
import requests
# 导入正则表达式模块
import re
# 导入csv模块
import csv
# 导入pandas
import pandas as pd
“”“保存csv”“”
csv_file = open('data.csv', mode='a', encoding='utf-8', newline='')
csv_writer