微信公众号接口
- 目前是个功能需要一个微信号并且允许网页微信登陆,我们就是利用网页微信进行爬取公众号;
- 用selenium.webdriver进行 模拟登陆需要二维码扫描验证,这是唯一一个比较麻烦做自动障碍;
- 目前我可以想到用手机虚拟机进行登陆微信一直登陆着进行脚本扫码的操作;(自动脚本还没写)
使用的包
from selenium import webdriver
import time
import json
import requests
import re,os
import random
import pandas as pd
from .wz import pa (我自己写的随机html头链接如下:https://blog.csdn.net/Black_God1/article/details/81660125)
需要的三个文件(Account、cookie、list)
1.Account文件(必须存在)
同目录下的Account.txt是存放账号密码内容如下:
{'user':"账号",'password':"密码"}
2.cookie(可选)
同目录下的cookie.txt是存放登陆cookie内容如下:
当然如果系统没有识别到文件存在会调用weChat_login函数进行模拟登陆自动生成cookie.txt文件
{"openid2ticket_ov5Tk54o8_PPfPWeXgOGO9kpLkCs": "Mn3T7yJWKPQ/8x/qmY8LK7Fkz+wAL1uJbrF9TMulCdQ=", "slave_sid": "dk9aZjgxdlhqWXM0NWxvVENXcXZHd2N3VU5peGdYaDg2cFUyVVVjZjR2UzlEN2x0VVJnNUFINlZzRjFNUV9fNFlUUUlfcDcyUXc5OVlVajl2dDZQSGZHQmZzMGlPcVpYMDJISTlnYkNValdTVE9WR1djdmFOcWVpWHU2MElQMlJORmtQWTRzRGt6d085emNQ", "data_bizuin": "3890517183", "data_ticket": "PK8P4UyAmW7CMFI9gJAG1PONi+z03HbEWQvNq2kNccgJbsK9YnNfyxVkdnAOuPyf", "uuid": "a932a8b89e1a216fb379ed9a85635c8a", "cert": "xwgCxkxcmgG44tqOGfAXe1KyTeyeNzGo", "slave_user": "gh_96ebab8643c5", "ticket": "1416379a74ae239c07bf916527cce26daea6b4df", "bizuin": "3890517183", "mm_lang": "zh_CN", "noticeLoginFlag": "1", "ticket_id": "gh_96ebab8643c5", "pgv_si": "s6858711040", "slave_bizuin": "3890517183", "pgv_pvi": "7409646592", "rand_info": "CAESIIvGO1Bxq5md62GrJS7S+iinWNEmQJlmilFozdN8Xkg4", "xid": "a92c4e3233a64f6e0f56860db1cb7531", "ua_id": "FUCTRQ7JLfpgEOUaAAAAAIUKhoS12g6sHLIe3a8r3uk="}
3.list(必须存在)
同目录下的list.txt是存放需要爬取的公众号名称一个或多个:
['程序员的时光','程序人生']
</