PS:主要使用selenuim和谷歌驱动
这个里面难点主要是如何自动登录163邮箱,因为163邮箱里面模块的id或者classname都是动态码
所有首先需要定位登录框的frame
这一步
需要使用selenuim中的模糊定位start-with
driver.find_element_by_xpath("//iframe[starts-with(@id, 'x-URS-iframe')
之后找到账号框的classname:email;和密码框:password
之后输入对应的邮箱账号密码
为了防止出现登陆验证码,使用了timesleep去模拟人登陆
之后,去判断是否存在未读邮件,如果存在,则点击进入
点击之后,进入邮件内容界面,之后选择对应的验证码所在行,进行提取
具体代码:
# -*- coding: utf-8 -*-
import time
import os
from selenium import webdriver
from bs4 import BeautifulSoup
# from docx import Document
# a