一、简介
Python 中的 socket 模块是用于网络编程的基本工具之一。它提供了一个简单而强大的接口,用于创建网络连接、发送和接收数据以及处理网络通信,python内置模块无需安装
二、使用案例
import socket
from urllib.parse import urlparse
import re
import time
import threading
now_time = lambda: time.time()
start_time = now_time()
img_list = [
"https://pic.netbian.com/uploads/allimg/220211/004115-1644511275bc26.jpg",
"https://pic.netbian.com/uploads/allimg/220215/233510-16449393101c46.jpg",
"https://pic.netbian.com/uploads/allimg/211120/005250-1637340770807b.jpg"
]
def get_image(url,name):
socket_client = socket.socket() #创建socket对象
url_info = urlparse(url) #解析url
socket_client.connect((url_info.netloc, 80)) #建立连接
http_header = f'GET {url} HTTP/1.0\r\nHost: {url_info.netloc}\r\nUser-Agent: ozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36\r\n\r\n' #模拟浏览器请求头
socket_client.send(http_header.encode()) #发送请求
result = b''
img_info = socket_client.recv(1024) #指定当前接收的最大字节
while img_info: #获取处的数据可能大于1024,循环获取字节
result += img_info
img_info = socket_client.recv(1024)
with open(f'{name}.jpg','wb') as img_file: #将获取的数据存入文件
img_info = re.search(b'HIT\r\n\r\n(.*)', result, re.S).groups()[0] #正则处理处理图片信息,HIT\r\n\r\n后的才是完整的图片信息
img_file.write(img_info)
socket_client.close()
if __name__ == '__main__':
for index,img_item in enumerate(img_list):
task = threading.Thread(target=get_image,args=(img_item,index))
task.start()
task.join()
三、方法及属性
- socket.socket():创建socket对象,socket_client=socket.socket()
- socket.gethostname():返回主机名host
- socket.gethostbyname(host):将主机名转换为ipv4地址
- socket.gethostbyname_ex(host):返回主机名、主机别名列表、主机IP地址列表
- socket.gethostbyaddr(ip):返回三元组(主机名,主机别名列表,主机IP地址列表)
- socket.getservbyport(port, protocolname):返回该端口号的服务名,仅限于本机
- socket.getservbyname(servicename,protocolname):返回该服务所在的端口号,servicename=服务名、protocolname=协议名
- socket.getsockname():返回自己捆绑的IPv4地址
- socket.getaddrinfo(host,port) 主机名,端口号 返回五元组,用于获取主机名的地址信息,兼容ipv4和ipv6
- socket.connect((host,port)):与该主机的端口进行远程连接,注意括号
- socket.gettimeout():返回socket超时时间,单位为s
- socket.settimeout(timeout):设置socket超时时间
- socket_client.accept():接受一个连接请求,并返回一个新的套接字对象和客户端地址
- socket_client.bind(address):将套接字绑定到指定的地址和端口,address=(ip,port),创建socket请求
- socket_client.listen(backlog):开始监听连接请求。backlog 参数指定在拒绝新连接之前可以排队的最大连接数
- socket_client.connect(address):连接请求地址,address=(ip,port)
- socket_client.recv(bufsize):从连接的另一端接收数据
- socket_client.recvfrom(bufsize) : 与recv(bufsize)方法的区别是返回值除了数据还有发送数据的地址,返回值是一个数据,地址对(data, address)
- socket_client.send(data):将数据发送到连接的另一端,data=二进制字符串
- socket_client.sendto(bytes, flags, address):基本与socket.send()相同
- socket_client.close():关闭套接字连接