python爬虫实战 | 批量爬取开放服务器的文件

本文介绍了一个使用Python爬虫批量下载FTP服务器上SPSS Modeler相关文件的实战案例。通过观察文件URL规律,查找并提取.pdf文件名,结合FTP目录构造完整文件链接进行下载。
摘要由CSDN通过智能技术生成

今天在查有关spss modeler的参考资料时,发现了这个网站:
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/modeler/14.2/zh_CN/

里面包含了许多有关spss modeler的文件,于是想用爬虫把它们都爬取下来。
这里写图片描述

文件不多,但是想到以后可能会遇到文件比较多的情况,到时候再根据这个程序拓展一下便可以了(虽然又要分析一次源代码~囧)。

废话少说,干活~

首先,观察文件的链接,对于第一个文件,它的url为:
这里写图片描述

对于第二个文件,它的url为ÿ

  • 0
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值