python模拟足球比赛_python爬虫笔记之爬取足球比赛赛程

最新推荐文章于 2022-12-05 00:12:48 发布

weixin_39630095

最新推荐文章于 2022-12-05 00:12:48 发布

阅读量792

点赞数

文章标签： python模拟足球比赛

本文介绍如何使用Python模拟请求动态网页并爬取足球比赛赛程。通过设置User-Agent规避反爬策略，利用正则表达式提取JSON中的比赛信息，并进行Unicode到中文的转换。文章还总结了Python 3中urllib.request模块的使用，以及正则表达式非贪婪模式的应用。

摘要由CSDN通过智能技术生成

目标：爬取某网站比赛赛程，动态网页，则需找到对应ajax请求(具体可参考：https://blog.csdn.net/you_are_my_dream/article/details/53399949)

# -*- coding:utf-8 -*-

import sys

import re

import urllib.request

link = "https://***"

r = urllib.request.Request(link)

r.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36')

html = urllib.request.urlopen(r,timeout=500).read()

html = bytes.decode(html,encoding="gbk")

#返回大量json，需提取

#找出返回json中对应正则匹配的字符串

js = re.findall('"n":"(.*?)"',html)

i=0

#循环打印比赛信息

try:

while(1):#将字符串Unicode转化为中文，并输出

print (js[i].encode('utf-8').decode('unicode_escape'),js[i+1].encode('utf-8

最低0.47元/天解锁文章

weixin_39630095

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python模拟足球比赛_python爬虫笔记之爬取足球比赛赛程

目标：爬取某网站比赛赛程，动态网页，则需找到对应ajax请求(具体可参考：https://blog.csdn.net/you_are_my_dream/article/details/53399949)# -*- coding:utf-8 -*-import sysimport reimport urllib.requestlink = "https://***"r = urllib.reques...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。