python下载豆丁网文档

最新推荐文章于 2023-12-05 15:11:38 发布

SenXXX

最新推荐文章于 2023-12-05 15:11:38 发布

阅读量7.8k

点赞数

分类专栏： python 文章标签： python 豆丁网文档

本文链接：https://blog.csdn.net/qq506657335/article/details/20006273

版权

豆丁网文档有自己的格式(docin),,所以需要下载下来后再解密。。。。

common.py文件在http://blog.csdn.net/qq506657335/article/details/20004903

docinDownloader.py

import re;
import os;
import common;
import docinParse;

reg_getDocinPageID = re.compile("http://www\.docin\.com/p-(\d+)\.htm");

def getPageID(url):
    try:
        return reg_getDocinPageID.findall(url)[0];
    except:
        return None;

class docinDownloader():
    def __init__(self):
        pass;
        
    def download(self, url, savePath = "./tmpDocin"):
        common.createDir(savePath);
        self._pageID = getPageID(url);
        self._title = common.getTitle(url).replace(" - 豆丁网", "");
        for i in range(1, 100):  #具体也不知道会有多少个文件, 所以只能一个个判断。。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SenXXX

关注关注

0
点赞
踩
18

收藏

觉得还不错? 一键收藏
4
评论
python下载豆丁网文档

豆丁网文档有自己的格式(docin),,所以需要下载下来后再解密。。。。common.py文件在http://blog.csdn.net/qq506657335/article/details/20004903docinDownloader.pyimport re;import os;import common;import docinParse;reg_
复制链接

扫一扫