Qt与Python脚本实战之一(爬虫)
-
Python环境安装
1.Python版本选择(2.7 or 3.6.x) 版本不同区别蛮大
2.安装pip 一个Python包管理工具 类似nodejs的npm(都是提供了海量第三方包)
-
编写python代码实现爬取.
1.需要用到的库有: Requests lxml 如果没有安装的请自己安装一下(pip install xxx)
2.IDE : pycharm or Qtcreator
3.python 版本: 3.6
4.代码实现的是多线程下载
-
实现功能
-
爬取指定网站的图片
-
按分类写入本地目录
-
按分类将本地图片写成ppt
-
QML界面展示爬取的图片内容
-
代码展示
# This Python file uses the following encoding: utf-8
# if__name__ == "__main__":
# pass
import sys
import requests
import os
import pathlib
import pptx
from pptx.util import Inches
from lxml import etree
from threading import *
from time import sleep
nMaxThread = 3 #这里设置需要开启几条线程
ThreadLock = BoundedSemaphore(nMaxThread)
gHeads = {
"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/5