系统学习python网络爬虫笔记(三)
这里写目录标题
第四章 计算机网络协议基础
1、什么是网络协议
2、一个完整的网络请求过程
3、IP地址和url详解
4、有哪些协议
5、TCP/IP
关于TCP/IP更多详细内容可以参考https://www.cnblogs.com/klb561/p/11485463.html或站内搜索TCP/IP
6、socket编程
7、基于tcp自定义一个协议-模拟qq服务器与客户端
需求:
1、实现聊天服务器
2、实现聊天客户端
功能:
1、登录
2、退出
3、发送消息
4、获取离线消息
5、获取在线用户
#服务器
#1. 转发消息
#2. 处理登录
#3. 处理退出
#4. 维护历史消息, 维护在线用户和维护用户的连接
import socket
import json
from collections import defaultdict
import threading
#1. 维护用户连接
online_users = defaultdict(dict)
#2. 维护用户的历史消息
user_msgs = defaultdict(list)
server = socket.socket()
#绑定ip
server.bind(("0.0.0.0", 8000))
server.listen()
def handle_sock(sock, addr):
while True:
data = sock.recv(1024)
json_data = json.loads(data.decode("utf8"))
action = json_data.get("action", "")
if action == "login":
online_users[json_data["user"]] = sock
sock.send("登录成功!".encode("utf8"))
elif action == "list_user":
#获取当前在线用户
all_users = [user for user, sock in online_users.items()]
sock.send(json.dumps(all_users).encode("utf8"))
elif action == "history_msg":
sock.send(json.dumps(user_msgs.get(json_data["user"], [])).encode("utf8"))
elif action == "send_msg":
if json_data["to"] in online_users:
online_users[json_data["to"]].send(json.dumps(json_data).encode("utf8"))
user_msgs[json_data["to"]].append(json_data)
elif action == "exit":
del online_users[json_data["user"]]
sock.send("退出成功!".encode("utf8"))
while True:
#阻塞等待连接
sock, addr = server.accept()
#启动一个线程去处理新的用户连接
client_thread = threading.Thread(target=handle_sock, args=(sock, addr))
client_thread.start()
#1. 多线程去处理每个用户连接,防止主线程阻塞住
#2. 自定义了消息协议并且自己完成了消息协议的解析
#客户端
import socket
import json
import threading
client = socket.socket()
client.connect(("127.0.0.1", 8000))
user = "bobby1"
#1. 登录
login_template = {
"action":"login",
"user":user
}
client.send(json.dumps(login_template).encode("utf8"))
res = client.recv(1024)
print(res.decode("utf8"))
#2. 获取在线用户
get_user_template = {
"action":"list_user"
}
client.send(json.dumps(get_user_template).encode("utf8"))
res = client.recv(1024)
print("当前在线用户:{}".format(res.decode("utf8")))
#2. 获取历史消息
offline_msg_template = {
"action":"history_msg",
"user":user
}
client.send(json.dumps(offline_msg_template).encode("utf8"))
res = client.recv(1024)
print("历史消息:{}".format(res.decode("utf8")))
exit = False
def hanle_receive():
#处理接收请求
while True:
if not exit:
try:
res = client.recv(1024)
except:
break
res = res.decode("utf8")
try:
res_json = json.loads(res)
msg = res_json["data"]
from_user = res_json["from"]
print("")
print("收到来自({})的消息: {}".format(from_user, msg))
except:
print("")
print(res)
else:
break
def handle_send():
while True:
#1. 随时可以发送消息
#2. 有新消息随时能接收到
op_type = input("请输入你要进行的操作: 1. 发送消息, 2. 退出, 3. 获取在线用户")
if op_type not in ["1","2","3"]:
print("不支持该操作!!!")
op_type = input("请输入你要进行的操作: 1. 发送消息, 2. 退出, 3. 获取在线用户")
elif op_type == "1":
to_user = input("请输入你要发送的用户:")
msg = input("请输入你要发送的消息")
send_data_template = {
"action": "send_msg",
"to": to_user,
"from": user,
"data": msg
}
client.send(json.dumps(send_data_template).encode("utf8"))
elif op_type == "2":
exit_template = {
"action": "exit",
"user": user
}
client.send(json.dumps(exit_template).encode("utf8"))
exit = True
client.close()
break
elif op_type == "3":
get_user_template = {
"action": "list_user"
}
client.send(json.dumps(get_user_template).encode("utf8"))
if __name__ == "__main__":
send_thread = threading.Thread(target=handle_send)
receive_thread = threading.Thread(target=hanle_receive)
send_thread.start()
receive_thread.start()
8、HTTP协议
http协议本质就是字符串,我们可以在代码中模拟这些字符串实现对网站的请求