我的第一个的python抓取单页面爬虫

最新推荐文章于 2022-03-29 10:54:04 发布

weixin_33894992

最新推荐文章于 2022-03-29 10:54:04 发布

阅读量230

点赞数

文章标签： python 爬虫

原文链接：http://blog.51cto.com/8292516/2068383

版权

爬取豆瓣推荐书籍页的图书的图片保存到本地

# -*- coding UTF-8 -*- 

import re
import requests
import os

def getsite(url):
    website=requests.get(url)

url="https://book.douban.com/tag/%E7%BC%96%E7%A8%8B"
website=requests.get(url)

links=re.findall("(https:\/\/img3.doubanio.com\/mpic\/(\w+\.jpg))",website.text)

dir="test/"
if not os.path.exists(dir):
    os.makedirs(dir)
count=0
for link,name in links:
    with open(dir+name,'wb') as img:
        file=requests.get(link)
        img.write(file.content)
        img.close()
        count+=1
        print("已抓取%s张图片"%(count))

转载于:https://blog.51cto.com/8292516/2068383

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_33894992

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
我的第一个的python抓取单页面爬虫

爬取豆瓣推荐书籍页的图书的图片保存到本地# -*- coding UTF-8 -*- import reimport requestsimport osdef getsite(url): website=requests.get(url)url="https://book.douban.com/tag/%E7%BC%96%E7%A8%8B"website=request...
复制链接

扫一扫