家里领导下了一个任务,把一个网页转成PPT。网页上有几十个图片,转成PPT,每个页面一个图片。说要是做的好,以后还有类似的网页要转。作为新时代的码农,总不能用CTRL+C 和 CTRL+V解决嘛。
先分析网页。图片代码如下:
找到下载链接。
上bs4 和 pptx库,当然少不了 Faker
import requests
from bs4 import BeautifulSoup
from pptx import Presentation
from pptx.util import Inches
import os
from faker import Factory
本段代码只适合爬取1页图片,如那种多页的,需要做判断,循环完成。
# encoding: utf-8
"""
@author: 陈年椰子
@contact: hndm@qq.com
@version: 1.0
@project:test
@file: web2ppt.py
@time: 2021-7-5 11:11
说明
从网页采集图片,生成PPT
"""
import requests
from bs4 import BeautifulSoup
from pptx import Presentation
from pptx.util import Inches
import os
from faker import Factory
# 生成user-agent
fc