爬虫入门-----静态网页
文章目录静态网页的爬取1.煎蛋网爬虫2.网易新闻头部 爬虫3.网易热点排行标题 爬虫4.os库5.debug模式6.天堂图片网 爬虫7.站酷网爬虫
静态网页的爬取
。
提示:以下是本篇文章正文内容,下面案例可供参考
1.煎蛋网爬虫
以下代码则简单爬取了煎蛋网的文章标题
#煎蛋网爬虫
import requests
from lxml import etree
url = 'http://jandan.net/'
#因为禁止访问,所以构造user-Agent,以及Cookie,模仿正常电脑.
原创
2021-01-17 21:03:57 ·
651 阅读 ·
6 评论