原创力文档是一个文档资源共享平台,文档内容类型丰富,包含计算机、高等教育、金融投资、医药卫生、汽车机械、外语学习、报告分析、法律法规、研究生考试、电子工程、经济贸易、建筑施工、幼儿小学教育、中学教育、文学历史、资格认证考试、人力资源、学术论文、行业资料、办公文档、生活休闲,满足你学习、工作之需,提高解决问题效率和能力!
经常看见有人发贴求原创力文档下载,正好最近在学python,就用python写了个原创力文档下载工具,授人以鱼不如授人以渔。
源代码如下:
"""
-*- coding: utf-8 -*-
文件名:原创力文档下载.py
作者:zhaozhao
环境: PyCharm
功能:原创力文档下载(仅支持可免费预览的部分)
"""
import os
import re
import requests
import time
from PIL import Image
from tqdm import tqdm
def get_html(url):
html = requests.get(url)
html.encoding = 'utf-8'
return html.text
def get_params(url):
html = get_html(url)
aid = re.findall(pattern='aid: (.*?),', string=html, flags=re.S)[1]
pages = re.findall(pattern='preview_page: (.*?),', string=html, flags=re.S)[0]
view_token = re.findall(pattern="view_token: '(