embed标签修饰的pdf文件下载——(embed src=“about:blank“)

今天需要在BioLib网站上看点东西,发现都是pdf文件,还不如下载下来
结果查看源代码后发现都是embed标签修饰,一开始有点蒙,因为src属性里没有链接。
最后发现直接用content就可以。淦。
幸亏没用自动化调试。
在这里插入图片描述
随便点进去一个
在这里插入图片描述
发现没有下载链接
但是!!!,打开它的Network,神奇的事情发生了
在这里插入图片描述
Content-Length的大小和pdf文档大小很接近,试着下载了一个,发现没有问题,内容无缺失。
既然已经找到了内容,思路理清后,代码也就水到渠成了

import requests
from bs4 import BeautifulSoup
import os

path = r'E:\desktop\BioLib'
url = 'http://www.biolib.de/library/pdf_index_de.html'
headers = {'user-agent': 'Mozilla/5.0'}

res = requests.get(url, headers)

soup = BeautifulSoup(res.text, 'html.parser')

box = soup.find('td', class_='boxrot')

files = box.find_all('a')

for file in files:
    title = file.text
    link = file['href']

    if not os.path.exists(path + '\\' + title):
        content = requests.get(link, headers, stream=True)

        size = 0
        chunk_size = 1024
        content_size = int(content.headers['content-length'])
        print('start download {title}, File size: {size:.2f} MB'.format(title=title,
                                                                        size=content_size / chunk_size / 1024))

        with open(path + '\\' + title, 'wb') as f:
            for data in content.iter_content(chunk_size):
                f.write(data)
                size += len(data)
                print('\r' + '[DOWNLOADING]:%s%.2f%%' %
                      ('>' * int(size * 50 / content_size), float(size / content_size * 100)), end=' ')
        print('\rFile %s download completed!' % title)
    else:
        print('File %s existed!' % title)

欢迎留言交流

只动脑,不动手,知识不长久

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
代码:< EMBED src=“music.mid”autostart=“true”loop=“2”width=“80”height=“30”> src:音乐文件的路径及文件名;(完整的路径或URL) ShowTracker:为是否显示播放进度条 ShowPositionControls:为是否显示播放控制按钮如快进等 ShowAudioControls: 为控制是否显示音量按钮 ShowStatusBar: 是否显示咨询窗 ShowDisplay: 为显示更完整的咨询视窗 EnableContextMenu: 防止使用右键 autostart:true为音乐文件上传完后自动开始播放,默认为false(否) loop:true为无限次重播,false为不重播,某一具体值(整数)为重播多少次 volume:取值范围为“0-100”,设置音量,默认为系统本身的音量 starttime:“分:秒”,设置歌曲开始播放的时间,如,starttime=“00:10”,从第10开始播放 endtime: “分:秒”,设置歌曲结束播放的时间 width:控制面板的宽 height:控制面板的高 controls:控制面板的外观 controls=“console/smallconsole/playbutton/pausebutton/stopbutton/volumelever” •console:正常大小的面板 •smallconsole:较小的面板 •playbutton:显示播放按钮 •pausebutton:显示暂停按钮 •stopbutton:显示停止按钮 •volumelever:显示音量调节按钮 hidden:为true时可以隐藏面板 embed标签src后的文件也可以是.swf文件,用来播FLASH 下面是例子:自动播放的并且隐藏控制按钮,禁止右键菜单的. 下面的是上面例子中使用的代码: <embed src="yin/01.mp3" _fcksavedurl=""yin/01.mp3"" _fcksavedurl=""yin/01.mp3"" type="application/x-mplayer3" loop="true" ShowStatusBar="true" ShowPositionControls="false" EnableContextMenu="false"></embed> 下面是real的播放器用法总结,是转贴:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ALittleHigh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值