建立自己的小型代理池
拥有一个代理池会很大程度上的帮助我们进行工作,经过一番研究,自己写了一个代理池的小程序,删去了很多的功能,留下了最主要得。
下边为自己的逻辑。
因为储存和获取模块相对简单,所以合成为一个模块。
粘贴出整个模块代码。
获取的代理的网站有很多,这里只写了一个,对于我自己来说是够用了。
import requests
from lxml import etree
import time
import pymongo
class CAT_IP():
def __init__(self):
self.client = pymongo.MongoClient(host='localhost',port=27017)
self.db = self.client['proxy']
self.session = requests.Session()
self.url = 'http://qhd.esf.fang.com/chushou/3_237041602.htm'
self.headers={
'Cookie':'_free_proxy_session=BAh7B0kiD3Nlc3Npb25faWQGOgZFVEkiJWYwNzA1YmIzM2QzNTU0NGNjNmMyNWI3NDk1M2FlNmE5BjsAVEkiEF9jc3JmX3Rva2VuBjsARkkiMTQ5K3ZlRkx2dGs3ZmZMZTBjd1VLR