Day 5 python 原生爬虫

尝试获取某知名直播平台姓名以及热度数据---需要更加熟练

import re
from urllib import request


# 端点调试
class Spider():
    url = 'https://www.huya.com/g/wzry'

    root_pattern = '<li class="game-live-item"> ([\s\S]*?) </li>'
    # name_pattern = '<i class="nick"> ([\s\S]*?) </i>'
    # num_pattern = '<i class="js-num"> ([\s\S]*?) </i>'


    def __fetch_content(self):
        r = request.urlopen(Spider.url)
        htmls = r.read()
        htmls = str(htmls, encoding='utf-8')
        return htmls


    def __analysis(self, htmls):
        root_html = re.findall(Spider.root_pattern, htmls)
        print(root_html[0])
        # anchors = []
        # for html in root_html:
        #     name=re.findall(Spider.name_pattern,html)
        #     number=re.findall(Spider.num_pattern,html)
        #     anchor = {'name':name,'number':number}
        #     anchors.append(anchor)
        # print(anchors[0])
        a = 1

    def go(self):
        htmls = self.__fetch_content()
        self.__analysis(htmls)
spider = Spider()
spider.go()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值