【福利】SACC 2016 PPT汇总下载

福利又来咯,这次是SACC 2016大会PPT汇总下载包。

这是知数堂Python运维开发班一位同学随手写的Python小程序,把SACC 2016大会的PPT都给爬下来打包了。

PPT合集下载地址:https://pan.baidu.com/s/1i5O9ygX,也可以识别下方二维码直达(此次爬PPT的Python小程序也在下载地址中)


来秀一下这个小程序吧,嘿

#!/usr/bin/env python
#coding:utf8
"""
Run on Linux
"""
import os
import re, urllib
 
 
#创建目录
_dir = 'SACC2016'
if not os.path.isdir(_dir):
     os.mkdir(_dir)
 
def geturlsrc(url):
     src = urllib.urlopen(url)
     html = src.read()
     return html
 
def getdsturl(html):
     #正则匹配各主(专)场URL
     urlreg = r '<li><a href="(http:.*)">'
     urlre =   re. compile (urlreg)
     urls = re.findall(urlre,html)
 
     for url in urls:
         html = geturlsrc(url)
         #正则匹配pdf文件URL
         pdfreg = r '<li><a href="(http:.*-)(.*).pdf" target="_blank">• (.*)</a><a href'
         pdfre = re. compile (pdfreg)
         pdfs = re.findall(pdfre, html)
 
         #下载
         for i in pdfs:
             url = i[ 0 ] + i[ 1 ] + ".pdf"
             _filename = i[ 1 ] + "-" + i[ 2 ] + ".pdf"
             filename = re.sub( '/' , '_' , _filename)
             print url, filename
             urllib.urlretrieve(url, _dir + '/' + filename)
 
 
url = geturlsrc( 'http://sacc.it168.com/PPT2016/' )
getdsturl(url)


最后再次感谢大家对知数堂培训的支持和关注!



老叶茶馆自营传统正味铁观音,自饮或馈赠均可,欢迎下单购买,有需要的识别下方二维码或访问 http://yejinrong.com 直达


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值