Trip: 给Requests加上协程，一百份网络请求一份时间

最新推荐文章于 2023-03-18 16:17:30 发布

LittleCoder0503

最新推荐文章于 2023-03-18 16:17:30 发布

阅读量955

点赞数

分类专栏： Python玩具集文章标签： tornado python 网络

本文链接：https://blog.csdn.net/jfmz6ofqmalumv6f/article/details/78422433

版权

Python玩具集专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Trip 是一个协程的网络库，如 Requests 一般简单的操作，程序不再被网络阻塞。

兼容 Python 2.7+ 的所有版本，主流三大操作系统。

基于两大依赖包：TRIP: Tornado & Requests In Pair。

感谢Tornado与Requests让想法可以快速变成现实，坦诚的说，这个项目我只做了一些简单的工作。

让协程变的简单

这是一个让协程变的简单的项目，你只需要这样：

import trip

@trip.coroutine
def main():
    r = yield trip.get('https://httpbin.org/get', auth=('user', 'pass'))
    print(r.content)

trip.run(main)

一百份请求一份时间

基于 Tornado 的协程让网络阻塞不再成为问题：（这里演示兼容用法）

import time, functools

import requests, trip

def timeit(fn):
    start_time = time.time()
    fn()
    return time.time() - start_time

url = 'http://httpbin.org/get'
times = 10 # 100 changed for inland network delay

def fetch():
    r = [requests.get(url) for i in range(times)]
    return r

@trip.coroutine
def async_fetch():
    r = yield [trip.get(url) for i in range(times)]
    raise trip.Return(r)

print('Non-trip cost: %ss' % timeit(fetch))
print('Trip cost: %ss' % timeit(functools.partial(trip.run, async_fetch)))

# Result:
# Non-trip cost: 17.90799999237s
# Trip cost: 0.172300004959s

由于协程的特性，所有的等待时间重合在了一起。

你不需要每个请求开一个线程，主线程中一切也可以井然有序的进行。

可以想象如果你在写一个爬虫，这将节省多少时间！

让协程服务人类

基于 Requests 的操作方式让协程 HTTP 从未如此简单：（这里使用 Python3 演示async/await）

>>> async def main():
...     global r
...     r = await trip.get('https://httpbin.org/basic-auth/user/pass', auth=('user', 'pass'))
...
>>> trip.run(main)
>>> r.status_code
200
>>> r.headers['content-type']
'application/json'
>>> r.encoding
None
>>> r.text
u'{"authenticated": true,...'
>>> r.json()
{u'authenticated': True, u'user': u'user'}

只要你有一些 Requests 基础就可以轻松使用 Trip，协程不再遥不可及。

重现了几乎所有 Requests 的操作，最大限度的减少了你的学习成本。

以一个爬虫为例

为了不打扰正常网站的运行，这里以httpbin.org作为目标网站。
设置 Cookies 模拟登陆，get 请求模拟爬取内容。

那么普通 Requests 是这样的：

import requests

url = 'http://httpbin.org'
s = requests.Session()

def fetch(times=10):
    s.get('%s/cookies/set?name=value' % url)
    r = [s.get('%s/get' % url) for i in range(times)]
    print r

fetch()

使用 Trip 以后就会变成这样：

import trip

url = 'http://httpbin.org'
s = trip.Session()

@trip.coroutine
def fetch(times=10):
    yield s.get('%s/cookies/set?name=value' % url)
    r = yield [s.get('%s/get' % url) for i in range(times)]
    print r

trip.run(fetch)