python爬虫--爬取某贴中的图片

最新推荐文章于 2023-08-21 08:00:00 发布

麋鹿_M

最新推荐文章于 2023-08-21 08:00:00 发布

阅读量464

点赞数

分类专栏： Python 文章标签： python爬虫

本文链接：https://blog.csdn.net/a769342421/article/details/47298559

版权

Python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

正在学习用python写爬虫，在网上看了一些博客，自己也尝试了一下。

本脚本的功能：对一个帖子进行翻页并下载正文中的图片

【源码】

#!/usr/bin/python
#coding:utf-8
import re 
import urllib
import urllib2

def gethtml(url):
    page=urllib.urlopen(url)
    html=page.read()
    return html

def getImg(html,y):
    reg=r'img class="BDE_Image" src="(.*?\.jpg)"'
    imgre=re.compile(reg)
    imglist=re.findall(imgre,html)
    #print imglist
    x=0
    for imgurl in imglist:
        path="C:\Users\John\Desktop\workspace1\GetImg\src\img\%s_%s.jpg"% (y,x)
        data=urllib.urlopen(imgurl).read()
        f=file(path,"wb")
        f.write(data)
        f.close()
        x+=1
        print "ok"

p=1
while(p<31):
    geturl="http://tieba.baidu.com/p/3831653735?pn=%s"% p
    print "正在下载第%s页图片..."%p    
    html=gethtml(geturl)
    getImg(html,p)
    p+=1
print "下载结束"

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

麋鹿_M

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫--爬取某贴中的图片

正在学习用python写爬虫，在网上看了一些博客，自己也尝试了一下。本脚本的功能：对一个帖子进行翻页并下载正文中的图片【源码】#!/usr/bin/python#coding:utf-8import re import urllibimport urllib2def gethtml(url): page=urllib.urlopen(url) html=
复制链接

扫一扫