python爬虫利用BeautifulSoup获取站酷图片网站的全部内容

最新推荐文章于 2022-05-23 21:01:48 发布

the hornets

最新推荐文章于 2022-05-23 21:01:48 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/xiaojiang0918/article/details/82666296

版权

import urllib.request
import os
import pyexcel_xls
from bs4 import BeautifulSoup
def crawler(url):
    headers = {
        "Accept": "application/json, text/javascript, */*; q=0.01",
        "X-Requested-With": "XMLHttpRequest",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36",
        "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8"
    }
    headersurl=urllib.request.Request(url,headers=headers)
    dataopen=urllib.request.urlopen(headersurl)

    #利用BeautifulSoup来分析数据
    bsoup=BeautifulSoup(dataopen,"html.parser")
    datas=bsoup.find_all("div",{"class":"card-box"})

    biglist=[]
    for x in datas:
        title=x.find("div",{"class":"card-img"}).find("a").get("title")
        titleimg=x.find(&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

the hornets

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python爬虫利用BeautifulSoup获取站酷图片网站的全部内容

import urllib.requestimport osimport pyexcel_xlsfrom bs4 import BeautifulSoupdef crawler(url): headers = { "Accept": "application/json, text/javascript, */*; q=0.01", "X-Requ...
复制链接

扫一扫