如何利用python下载原创力文档

最新推荐文章于 2024-10-15 10:54:28 发布

破碎的天堂鸟

最新推荐文章于 2024-10-15 10:54:28 发布

阅读量1.6k

点赞数 19

分类专栏：学习教程文章标签： python 服务器开发语言

本文链接：https://blog.csdn.net/m0_61505785/article/details/139383964

版权

原创力文档是一个文档资源共享平台，文档内容类型丰富，包含计算机、高等教育、金融投资、医药卫生、汽车机械、外语学习、报告分析、法律法规、研究生考试、电子工程、经济贸易、建筑施工、幼儿小学教育、中学教育、文学历史、资格认证考试、人力资源、学术论文、行业资料、办公文档、生活休闲，满足你学习、工作之需，提高解决问题效率和能力！

经常看见有人发贴求原创力文档下载，正好最近在学python，就用python写了个原创力文档下载工具，授人以鱼不如授人以渔。

源代码如下：

"""
-*- coding: utf-8 -*-
文件名:原创力文档下载.py
作者：zhaozhao
环境: PyCharm
功能：原创力文档下载(仅支持可免费预览的部分)
"""
import os
import re
import requests
import time
from PIL import Image
from tqdm import tqdm

def get_html(url):
    html = requests.get(url)
    html.encoding = 'utf-8'
    return html.text

def get_params(url):
    html = get_html(url)
    aid = re.findall(pattern='aid: (.*?),', string=html, flags=re.S)[1]
    pages = re.findall(pattern='preview_page: (.*?),', string=html, flags=re.S)[0]
    view_token = re.findall(pattern="view_token: '(