python利用线程池抓取页面

import socket


def threaded_method():
    sock = socket.socket()
    sock.connect(('xkcd.com', 80))
    request = 'GET /353/ HTTP/1.0\r\nHost: xkcd.com\r\n\r\n'
    sock.send(request.encode('ascii'))
    response = b''
    chunk = sock.recv(4096)
    while chunk:
        response += chunk
        chunk = sock.recv(4096)

    print(response)

threaded_method()


s.socket()创建套接字

s.connect()连接到address处的套接字。一般格式为元组(hostname,port),连接错误则返回socket.error。80端口是为超文本传输协议开放的,当然连接80啦

s.recv(),参数格式s.recv(bufsize[,flag]),接收tcp套接字数据并返回字符串。bufsize指定要接收的最大数据量

s.send(string[,flag]),发送tcp数据,将string中的内容发送到连接到的套接字,返回值是要发送的数据数量。该数量可能小于string的字节大小

string.encode()编码字符串,这个都懂的

上述代码域名可以替换为任意主机域名的说。基础内容就这些

代码出处:500 lines or less

 

转载于:https://www.cnblogs.com/bitch1319453/p/6566038.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python异步线程池是一种用于处理并发任务的机制,它可以在执行任务时提高效率和性能。异步线程池允许同时执行多个任务,并且可以在任务之间进行切换,从而避免了阻塞等待的情况。 在Python中,异步线程池通常使用`concurrent.futures`模块中的`ThreadPoolExecutor`类来实现。`ThreadPoolExecutor`提供了一种简单的方式来创建和管理线程池,并且可以方便地提交任务和获取任务的结果。 以下是使用Python异步线程池的一般步骤: 1. 导入`concurrent.futures`模块。 2. 创建一个`ThreadPoolExecutor`对象,指定线程池的大小。 3. 使用`submit()`方法提交任务到线程池中,该方法返回一个`Future`对象,表示任务的未来结果。 4. 使用`result()`方法获取任务的结果,该方法会阻塞直到任务完成并返回结果。 5. 使用`shutdown()`方法关闭线程池。 下面是一个简单的示例代码,演示了如何使用Python异步线程池: ```python import concurrent.futures # 定义一个任务函数 def task(n): return n * n # 创建一个线程池 with concurrent.futures.ThreadPoolExecutor() as executor: # 提交任务到线程池 future = executor.submit(task, 5) # 获取任务的结果 result = future.result() print(result) ``` 这个示例中,我们定义了一个简单的任务函数`task()`,它接受一个参数并返回参数的平方。然后,我们使用`ThreadPoolExecutor`创建了一个线程池,并使用`submit()`方法提交了一个任务到线程池中。最后,我们使用`result()`方法获取任务的结果并打印出来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值