python爬百度文库课件

最新推荐文章于 2024-04-18 01:05:25 发布

weixin_30481087

最新推荐文章于 2024-04-18 01:05:25 发布

阅读量100

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/vvlj/p/9662534.html

版权

库:re;selenium;requests

源码：

from selenium import webdriver
import re
import requests

def open_img(items):
    for item in items:
        item = re.sub('&','&',item)
        rsp =requests.get(item)
        yield rsp.content

url ='https://wenku.baidu.com/view/4e3d35d969eae009581becd5.html?from=search'　　　　#可修改成别的ppt网址
browser =webdriver.Chrome()
try:
    browser.get(url)
    html =browser.page_source
    pattern =re.compile('<div class="ppt-page-item.*?src="(.*?)".*?>',re.S)
    items =re.findall(pattern,html)
    n =0
    for i in open_img(items):
        with open('%d.jpeg'%n,'wb') as file:
            file.write(i)·
            n +=1
            print('第%d张图片下载完成'%n)

finally:
    browser.close()
input()

转载于:https://www.cnblogs.com/vvlj/p/9662534.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30481087

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python爬百度文库课件

库:re;selenium;requests源码：from selenium import webdriverimport reimport requestsdef open_img(items): for item in items: item = re.sub('&amp;','&',item) rsp =reque...
复制链接

扫一扫