[PYTHON]SCRAPY学习笔记(二)使用REDIS构建队列

为了构建分布式爬虫,使用高效的REDIS数据库构建队列,

统一采用先进先出模式。

因为内存数据库是临时保存的(关机或重启数据就会释放),且不能将分配的内存占满,占满后无法进行操作,因此应该适当根据分配的内存控制队列长度。

import redis
from .model import PageProjectList, Session


class Queue(object):
    def __init__(self, queue_type):
        '''
        :param queue_type: 指定队列的种类,
        目前主要有project_json,building_json,room_json,roomid四种,
        消息队列统一采用先进先出的模式进行管理
        '''

        self.type = queue_type

        self.conn_pool = redis.ConnectionPool(host='10.73.9.21',
                                              port='6379',
                                              password='',
                                              decode_responses=True,
                                              db='1')

        self.re_pool = redis.Redis(connection_pool=self.conn_pool)
        # 构建连接池

    def fidPut(self, value):
        '''
        :param roomid_value: 待放入redis队列的roomid值
        :return: 放入redis队列
        '''
        self.re_pool.rpush(self.type, value)

    def fidGetStr(self):
        value = self.re_pool.blpop(self.type)[1]
        print("取出的roomid值为" + value)
        return value

    def qsize_int(self):
        '''
        :return: 返回队列的大小,整型
        '''
        return self.re_pool.llen(self.type)


if __name__ == '__main__':
    q = Queue("page_list")
    while q.qsize_int() < 500:
        r = Session.query(PageProjectList).filter(PageProjectList.STATE == 0).first()
        q.fidPut(r.FID)
        r.STATE = 8
        Session.commit()

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值