[bigdata-56] py3+selenium 抓取学信网 最简demo

各种情况不考虑,只演示核心功能。


#!/usr/bin/env python3
# !-*- coding:utf-8 -*-

"""
演示如何抓取学信网
"""

import time

from selenium import webdriver

def get_sub_regions(browser, url):
    #登录页面
    browser.get(url)
    #输入用户名
    elem = browser.find_element_by_id('username')
    elem.clear()
    elem.send_keys('187xxxxxxxx')
    elem = browser.find_element_by_id('password')
    #输入密码
    elem.clear()
    elem.send_keys('99xxxxx')
    #点击登录
    elem = browser.find_element_by_xpath('//input[@class=\"btn_login btn_login_my\"]')
    elem.click()
    # 点击进入查看页面
    time.sleep(5)
    elem = browser.find_element_by_xpath('//a[@class=\"login-btn\"]')
    elem.click()
    # 高等教育信息
    time.sleep(5)
    elem = browser.find_element_by_xpath('//a[@href=\"gdjy/xj/show.action\"]')
    elem.click()
    # 样例查询
    time.sleep(5)
    # elem = browser.find_element_by_xpath('//div[@class=\"main\"]')
    elems = browser.find_elements_by_xpath('//div[@class=\"m-left xj-left main-block border-shadow\"]')
    for i in elems:
        print(i.text)

def main():
    #启动浏览器
    browser = webdriver.Firefox()
    #登录学信网
    sh_business_regions = get_sub_regions(browser,
      'https://account.chsi.com.cn/passport/login?service=https%3A%2F%2Fmy.chsi.com.cn%2Farchive%2Fj_spring_cas_security_check')

if __name__ == '__main__':
    main()


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值