初探Python爬虫---抓取豆瓣上霍建华图片

本文介绍了一种使用 Python 的 requests 和 BeautifulSoup 库来爬取豆瓣网站上火 Jian Hua 相册图片的方法。代码实现了通过指定页数抓取图片,并将其保存到本地指定文件夹的功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import requests
import os
from bs4 import BeautifulSoup

def getHtml(url,kv):
	try:
		r = requests.get(url,params=kv)
		r.raise_for_status()
		r.encoding='utf-8'
		return r.text
	except:
		return '抓取失败'
def getJpg(page):
	Path = 'D://huojianhua//'
	Url='https://movie.douban.com/celebrity/1015713/photos/'
	if not os.path.exists(Path):
		os.makedirs(Path)
	for page in range(page):
		kv = {'type':'C','start':str(page*30),'sortby':'size','size':'a','subtype':'a'}
		html = getHtml(Url,kv)
		soup = BeautifulSoup(html,'html.parser')
		uls = soup.find_all('ul' , {'class':'poster-col3 clearfix'})
		filename=1
		for ul in uls:
			imgs = ul.find_all('img')
			for img in imgs:
				imgUrl = img['src']
				Jpg = requests.get(imgUrl).content
				with open(Path+str(filename)+'.jpg','wb') as pf:
					pf.write(Jpg)
				filename+=1
if __name__ == '__main__':
	getJpg(2)

这次使用的BeautifulSoup,简单方便,适合初学者

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值