DotaMax网站”获取“自己与职业选手(知名玩家)对战记录

Welcome

笔者在5-6年前曾“沉迷”于Dota2,当时水平也还可以,因此匹配到过许多职业选手/知名的玩家,但想要通过网站/APP找回比赛信息实属一个体力活,因此想到用爬的方法来自动获取。

效果展示

比赛ID与职业选手名统计次数

观察DotaMax网站

DotaMax官网为DotaMax
可以在该网站里查看自己所有的比赛记录
但是需要登录Max+账号
可以看到职业选手/知名玩家的名字旁有认证选手的标志。爬虫要做的实际上就是遍历某位玩家所有比赛场次,并标记出 出现认证选手的比赛ID。
对战记录

在Chrome中查看网页源代码

普通玩家
职业选手
可以发现职业选手名字后面有一坨这个
接下来就可以开始正式写代码了

开始码字

本文使用Chorme浏览器与Python3.6
用到的库为:

import requests
import re
import pandas as pd
from collections import Counter;

登录dotamax账号

第一步就难到笔者了,因为之前爬的网站都是不需要登录的。但是dotamax的爬虫比较简单,只需要加一个Cookies就可以了

步骤一:手动登录Dotamax

进入Dotamax主页 DotaMax 登录
点击登录
在这里插入图片描述
登陆完进入到主页后 按F12
在这里插入图片描述
发现啥都没有 这时候F5刷新页面
在这里插入图片描述
现在有了login/文件,单击打开
在这里插入图片描述
这两条cookie和pkey就是我们需要的cookies
将他们复制

步骤二:保存Cookies到Python

cookie = {
        "cookie": "xxxxxxxx",
        "pkey": "xxxxxxxx",
    };

cookie pkey分别都是浏览器中复制黏贴下来的
本想设置header头文件,然而发现并不需要,直接request就行

steam_ID = ######直接输入dota2的ID
url = 'http://www.dotamax.com/player/match/{}'.format(steam_ID)
r = requests.get(url, cookies=cookie).text’

这样就可以自动登录Dotamax来”自动获取“信息了
就写到这里,后面的步骤比较简单,笔者也是新手,第一次碰到需要Cookie的情况,因此简短记录一下。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值