一、登陆
原文地址:http://www.tnblog.net/cz/article/details/162
采用扫码二维码的方式登陆,就是得下个app。。 验证码太烦了,不想搞
1.获取二维码:
先分析二维码一般是一张图片,我们把他下载到本地 来方便扫码
图片还是base64的数据形式
但是我们用传统的方式爬下来 并不能取到图片的信息,只有一个图片占位标签
拿到的东西没有src内容 但是页面上却有,说明图片的url是动态获取填充的
(用到了 SoupStrainer 库安装pip install beautifulSoup4,介绍:开坑中 )
继续分析,发现有这样一个请求,可以拿到图片的src内容
图片是base64形式存储的 可以直接把他保存为图片 (base64:二进制编码数据形式,图片存数据库一般就这样放,取出来解析就是一张图,但是一般会比较长。。 )
需要用到一个库操作图片pip install pillow
由于图片是base64 还需要引入base64的库解码
模拟请求,下载图片:
地址:https://kyfw.12306.cn/passport/web/create-qr64
参数:{appid:otn} //固定的
返回:
{"result_message":"生成二维码成功","result_code":"0","image":"iVBORw0KGgoAAAANSUhEUgAAAMcAAA......","uuid":"4B-aKlPZTyR4xlPGh7wmTz553-0ep8w-Lufw8sVxCir-mcQuzTf9iZPX-M4OZYBWjRiASiGJaiv0we1"}
代码:
import base64
import json
import os
import re
import requests # 用requests库,方便保存会话 功能和urllib差不多
from bs4 import BeautifulSoup, Soup