摘要:这篇文章主要通过使用BeautifulSoup,requests,和re库来从某指定eBay某商品页面获取该商品的高清大图
1. 先获取商品页面的html源码,并构建一个BeautifulSoup对象,使得之后更容易分析源码
import requests
import re
import bs4
url = 'https://www.ebay.com/itm/CHANEL-Coco-Cocoon-Small-Tote-Leather-Black-A47108-Free-Shipping-/133298438568?hash=item1f0934c1a8'
res = requests.get(url)
soup = bs4.BeautifulSoup(res.text, features="lxml")
2. 分析页面抓取的关键标签
用chrome开发者工具看下源码块,不难发现商品的图片链接应该都在div标签下id=“PicturePanel”下:
不妨先用BeautifulSoup输出一下这个标签,看一下里面的图片标签有什么特点:
div = soup.find_all('div', id="PicturePanel")
输出结果里专门提出img标签发现它们大概长这样:
<img alt="CHANEL-Coco-Cocoon-Small-Tote-Leath