BeautifulSoup库用链接采集1688和某宝的详情图片和视频

最新推荐文章于 2024-03-13 09:44:44 发布

管火火火

最新推荐文章于 2024-03-13 09:44:44 发布

阅读量1.4k

点赞数

分类专栏： python 文章标签：音视频 python 开发语言

本文链接：https://blog.csdn.net/weixin_38373875/article/details/121157265

版权

本文介绍了如何利用Python的BeautifulSoup库，通过输入链接来抓取1688和淘宝商品详情页的图片及视频资源。通过简单的脚本实现，实现了高效的数据采集。

摘要由CSDN通过智能技术生成

最近写了一个脚本使用python的BeautifulSoup库，填写链接采集1688和某宝详情图片和视频

非常简单，贴上代码

# -*- coding: utf-8 -*-
import re

from bs4 import BeautifulSoup

url="https://detail.1688.com/offer/645116361079.html"
#发送请求
import requests
#导入第三方

#发送请求 获取返回值	
res=requests.get(url)
print(res)
#解析反馈内容
soup=BeautifulSoup(res.text,"html.parser")

# print("soup",soup)
#寻找标签
# url3=soup.find_all(iDetailData)
# print(url3)
url2=soup.find_all("div",class_="mod-detail-attributes mod-info mod")[0]['data-feature-json']
# print(url2)
#找到data-tfs-url所对应的网址desc-lazyload-container
url1=soup.find_all("div",class_="desc-lazyload-container")[0]['data-tfs-url']


#发送请求 获取返回值
res=requests.get(url1)
print("res",res)

#再次解析反馈内容
soup1=BeautifulSoup(res.text,"html.parser")
print(soup1)


#获取img
img1=soup1.find_all("img")
mp41=soup1.find_all("mp4")
#prin