Python学习小记-爬虫基础例子之抓取热门游戏排行榜-2020-3-2

import urllib.request
import re
import os
class hotgame():
    def __init__(self):
        self.url = "http://top.baidu.com/buzz?b=173&c=16&fr=topcategory_c16" #初始化的url
    def send(self,url): 
        res = urllib.request.urlopen(url)
        web = res.read().decode("gb2312")
        pat = re.compile(r'<a class="list-title" target="_blank" href=".*?">(.*?)</a>')
        res1 = re.findall(pat, web)
        if os.path.exists("热门游戏.txt"): #这里是判断是否存在此文件,存在的话删掉
            os.remove("热门游戏.txt")
            for i in res1:
                self.write_f(i)
        else:
            for i in res1:
                self.write_f(i)
    def write_f(self,content): #写入文件功能
            with open("热门游戏.txt", "a", encoding="utf-8") as f:
                f.write(content + "\n")

    def start(self):
        self.send(self.url)
if __name__ == '__main__':  #当py文件运行时候,这个下面的代码将被运行
    download =hotgame()
    download.start()

提取数据来源百度搜索风云榜上的游戏排行。欢迎各位大神进行指点优化。初学Python,没有系统的去看完整的教程,主要学习方法就是按照其他书中或者视频中的思路去完成自己想到的功能。分析和理解其他人的实例代码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值