python is beautiful,Python Beautifulsoup img标签解析

最新推荐文章于 2024-02-21 18:19:02 发布

敢持

最新推荐文章于 2024-02-21 18:19:02 发布

阅读量251

点赞数

文章标签： python is beautiful

I am using beautifulsoup to parse all img tags which is present in 'www.youtube.com'

The code is

import urllib2

from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen('http://www.youtube.com/')

soup = BeautifulSoup(page)

tags=soup.findAll('img')

But am not getting all img tags.The getting img tags are invalid also.

The img tags which i got after parsing is different from the page source img tags. Some attributes are missing.

I need to get all video img tags in youtube.com

Please help

解决方案

Seems to work when I try it here

import urllib2

from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen('http://www.youtube.com/')

soup = BeautifulSoup(page)

tags=soup.findAll('img')

print "\n".join(set(tag['src'] for tag in tags))

Produces this which looks OK to me

http://i1.ytimg.com/vi/D9Zg67r9q9g/market_thumb.jpg?v=723c8e

http://s.ytimg.com/yt/img/pixel-vfl3z5WfW.gif

//s.ytimg.com/yt/img/pixel-vfl3z5WfW.gif

/gen_204?a=fvhr&v=mha7pAOfqt4&nocache=1337083207.97

http://i3.ytimg.com/vi/fNs8mf2OdkU/market_thumb.jpg?v=4f85544b

http://i4.ytimg.com/vi/CkQFjyZCq4M/market_thumb.jpg?v=4f95762c

http://i3.ytimg.com/vi/fzD5gAecqdM/market_thumb.jpg?v=b0cabf

http://i3.ytimg.com/vi/2M3pb2_R2Ng/market_thumb.jpg?v=4f0d95fa

//i2.ytimg.com/vi/mha7pAOfqt4/hqdefault.jpg

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

敢持

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python消找出img中的src标签_使用beautifulsoup从img标签获取src

weixin_39625162的博客

12-10

1913

这是我最后一次求救帮助我正在尝试使用我的不和机器人进行一些很酷的嵌入，唯一的问题是我无法从网站获取img到任何人都可以帮忙吗？大部分情况下，这是其他人告诉我使用的代码，这里找到的代码不起作用。使用beautifulsoup从img标签获取srcasync def events(self, ctx):"""Top GTAO bounses going on right now!"""if ctx.m...

beautifulsoup爬取网页中的表格_Python 爬虫基础教程——BeautifulSoup抓取入门

weixin_39923945的博客

11-20

1632

点击上方蓝色文字关注我们吧有你想要的精彩作者| 東不归出品 | Python知识学堂大家好，上篇推文介绍了爬虫方面需要注意的地方、使用vscode开发环境的时候会遇到的问题以及使用正则表达式的方式爬取页面信息，本篇内容主要是介绍BeautifulSoup模块的使用教程。BeautifulSoup介紹引用官方的解释：Beautiful Soup 是一个可以从HTML或XML文件中提取数据...

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫基础之requests+BeautifulSoup+Image 爬取图片并存到本地（五）

Blessy_Zhu的博客

12-22

9183

刚学python不久，写了一个自己认为还比较简单易懂“爬取图片的方式，并保存本地指定路径下”。我爬取的内容是“Yestone邑石网”的部分图片链接如下，https://www.yestone.com/gallery/1501754333627 爬取的页面如图1所示。　　图1 爬取的Python代码如下 import requests from bs4 import BeautifulSoup ...

python is beautiful_Python Beautifulsoup img标签解析

weixin_39557199的博客

11-23

I am using beautifulsoup to parse all img tags which is present in 'www.youtube.com'The code isimport urllib2from BeautifulSoup import BeautifulSouppage = urllib2.urlopen('http://www.youtube.com/')sou...

奔跑的犀牛先生

06-06

2573

一个使用BeautifuleSoup爬图片pic的代码的例子使用 BeautifulSoup下载网页图片到本地文件夹

python课程设计笔记(五) ----Resuests+BeautifulSoup （爬虫入门）

萌兔兔MMQ！！

03-20

314

目标从一个HTML或XML文件中提取数据，节省人工的时间。我这里提取一个html页面（https://www.zxzhijia.com/tuce/f1301_h_m )的所有图片。需要安装的：requests 和 beautifulsoup，lxml解析器 requests 安装： pip install requests beautifulsoup 安装：pip install beautifulsoup4 lxml解析器安装：pip install lxml requests: 获取某个URL的内容

用python和Beautiful Soup来做一个图片下载器（优化版）

用沸腾的热血，支付我们的人生吧！

12-20

1223

前言这是一个使用python和beautifulsoup4编写的图片下载程序，主要支持视觉中国网站，可以获取当前网址网页的图片列表，有3种图片下载方式，全部下载、单张下载以及任意张下载。本例是在之前的一篇博文的基础上，进行了优化了，使界面看起来更整齐，增加了网页浏览。实际窗口：如上图，可以直接在“图片获取网址”处输入网址，然后点击获取列表按钮，也可以先在“网址”处输入网址，如视觉中国，可以在界面内的浏览器浏览网页，寻找需要的图片页面，网址会自动更新。右侧是下载按钮，图片保存地址默认是桌面，也可以手动

Python爬虫之网页解析器(Beautiful Soup)

weixin_44369119的博客

01-17

591

Python爬虫之网页解析器(Beautiful Soup)

python中soup_python中BeautifulSoup的详细介绍（附代码）

weixin_39756416的博客

12-10

3897

本篇文章给大家带来的内容是关于python中BeautifulSoup的详细介绍(附代码)，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。Beautiful Soup自动...

新手Python爬虫教学（Request+BeautifulSoup）

qq_43232498的博客

04-14

3139

新手学习Python爬虫之Request和beautifulsoup Created: Apr 13, 2020 2:45 PM 学了一下爬虫基本原理，利用request和beautiful soup爬了最简单的网页。为了巩固学到的东西，写了一篇总结：首先，说一下我现在能爬的这些网页的基本特点：在Network中，文档类型为document的请求响应中可以找到需要爬取的所有内容。不需要登陆...

【python爬虫 2】BeautifulSoup快速抓取网站图片

大家一起学编程(python)

01-12

4134

学习，最重要的是要了解它，并且使用它，正所谓，学以致用、本文，我们将来介绍，BeautifulSoup模块的使用方法，以及注意点，帮助大家快速了解和学习BeautifulSoup模块。有兴趣了解爬虫的小伙伴们，赶快学起来吧。关注公众号可获取爬虫教程哦。

python用BeautifulSoup库简单爬虫入门+案例（爬取妹子图）

weixin_34417635的博客

09-15

473

会用到的功能的简单介绍 1、from bs4 import BeautifulSoup #导入库 2、请求头herders headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/5...

python3 beautifulsoup配合requests下载老司机图片

drawAgirl的博客

09-19

721

学python爬虫也一个星期了，写个博客总结下。我爬虫用的库是beautifulsoup和requests。确实很适合新手使用，认真花一天时间就能上手爬点东西了。代码如下 from multiprocessing import Pool from bs4 import BeautifulSoup import requests import os import threading fr...

python使用BeautifulSoup和requests库如何抓取一幅图片

qq_31397725的博客

02-16

411

要使用Python的BeautifulSoup和requests库抓取一幅图片，你可以按照以下步骤进行：安装BeautifulSoup和requests库（如果你还没有安装的话）：bash复制编写Python代码，使用requests库发送HTTP请求获取网页内容，然后使用BeautifulSoup库解析HTML，找到图片的URL。使用requests库下载图片到本地。下面是一个简单的例子，演示如何抓取一幅图片：python复制import os。

爬虫小案例04—使用Beautiful Soup批量获取图片

小伟的博客

02-26

3330

图片下载方式

利用beautifulsoup获取网页图片