Python3实现原生爬虫,不用框架,用正则表达式【详细代码+注释】
简单说下我对爬虫的理解,爬虫即对HTML进行文本分析,提取所需内容在爬虫前,需要明确目的,找到数据对应的网页,并分析网页结构找到数据的标签要爬的网站是熊猫TV目的:熊猫TV下,某个游戏下主播的人气排行,爬取主播名字、观看人数版本是python3.5.2,以学习为主,只使用正则表达式from urllib import requestimport reclass Spider():...
原创
2018-12-24 22:11:13 ·
1022 阅读 ·
0 评论