开发环境:windows 7
开发工具:pycharm
python版本:python 3.7
用到的库:os,urllib,requests,hashlib
关键步骤:
- 通过浏览器分析找到请求接口
- 分析接口返回的内容及数据格式
- 提取出图片链接
- 将图片保存到本地
实现代码:
# coding = utf-8
# author: Alvin
import os
import requests
from urllib.parse import urlencode
from hashlib import md5
def get_page(offset):
params = {
'offset': offset,
'format': 'json',
'keyword': '街拍',
'autoload': 'true',
'count': '20',
'cur_tab': '1'
}
url = 'https://www.toutiao.com/search_content/?' + urlencode(params)
user_agent = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.84 Safari/537.36'
headers =