# coding=utf-8
import re
import webbrowser
import requests
session = requests.Session()
url = 'http://t.30edu.com.cn/Login.DoLogin.data'
info = {
'UserName': '********',
'PassWord': '*******',
'IsSave': True,
'host': '.30edu.com.cn'
}
r = session.post(url, info)
# print r.text
# file=open('file.txt','w')
j = 0
for page in range(25, 125):
r = session.get('http://z.30edu.com.cn/Knowledge/A1/?page={}'.format(page))
# print(r.text)
pattern = re.compile('<a href="/A1/(.*).shtml">')
# print re.findall(pattern,r.text)
for i in re.findall(pattern, r.text):
detail_url = 'http://z.30edu.com.cn/download/?id={id}&SubjectID=A1'.format(id=i)
# 在系统的默认浏览器中访问url地址,如果new=0,url会在同一个浏览器窗口中打开;如果new=1,新的浏览器窗口会被打开;new=2新的浏览器tab会被打开。
webbrowser.open(detail_url, new=0, autoraise=True)
Python爬虫 模拟登录
最新推荐文章于 2024-07-01 08:30:00 发布