![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 78
George_ray
我很懒且很帅
展开
-
Scrapy框架
1原创 2021-05-24 17:55:37 · 181 阅读 · 0 评论 -
python 爬虫入门
三个流程 获取网页 解析网页 存储数据 获取网页 获取网页的基础:requests、urllib、selenium 进阶:多线程、登录抓取、突破ip封禁、使用服务器抓取 解析网页 基础:re正则表达式、Beautiful、lxml 进阶:解决中文乱码 存储数据 基础:存入txt和csv文件 进阶:存入MySQL\MongoDB数据库 或者直接用Scrapy框架。 编写一个简单的爬虫 import requests import time from bs4 import BeautifulSoup li原创 2021-05-24 12:12:43 · 132 阅读 · 0 评论