Python爬校OJ排名名单

感觉真是应了那句学需要用的东西

然后就能用了

没有自动登录爬 就是把网页代码保存成txt爬的

鸡肋不要紧 能用就成

import requests
import pandas
from pandas import Series
from pyquery import PyQuery as pq

def test():
    pandas.set_option('display.max_rows', None)#显示所有行
    with open('C:/Users/79823/Desktop/sta.txt', 'r', encoding='UTF-8') as f:
        a=pq(f.read())
        i=0
        data={}
        frame=pandas.DataFrame(data=data, columns=('name', 'sno', 'spe'))
        for i in range(1, 200):#上限
            b=pq(a('tr').eq(i))
            if b != '':   
                sno=b.find('td').eq(3).text()
                if len(sno)==10:
                    if sno[3]=='8' or (sno[3]=='7' and sno[4]!='1' and sno[5] != '1'):#筛选合格的人(18级或预科)
                        name=b.find('td').eq(2).text()
                        spe=b.find('td').eq(5).text()
                        data={'name':[name], 'sno':[sno], 'spe':[spe]}
                        frame = frame.append(pandas.DataFrame(data=data, columns=('name', 'sno', 'spe')), ignore_index=True)
                    
    print(frame)
                        
test()

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值