数据采集技术与数据清洗——使用Socket库连接百度首页

进入pycharm先复制服务端代码并运行,在用客户端代码并运行

服务端代码

#coding:utf-8

from socket import *
from time import ctime

print("=====================时间戳TCP服务器=====================");

HOST = '127.0.0.1'  #主机号为空白表示可以使用任何可用的地址。
PORT = 21567  #端口号
BUFSIZ = 1024  #接收数据缓冲大小
ADDR = (HOST, PORT)

tcpSerSock = socket(AF_INET, SOCK_STREAM) #创建TCP服务器套接字
tcpSerSock.bind(ADDR)  #套接字与地址绑定
tcpSerSock.listen(5) #监听连接,同时连接请求的最大数目

while True:
    print('等待客户端的连接...')
    tcpCliSock, addr = tcpSerSock.accept()   #接收客户端连接请求
    print('取得连接:', addr)

    while True:
        data = tcpCliSock.recv(BUFSIZ)  #连续接收指定字节的数据,接收到的是字节数组
        if not data:  #如果数据空白,则表示客户端退出,所以退出接收
            break
        #tcpCliSock.send('[%s] %s' % (bytes(ctime(), 'utf-8'), data))
        tcpCliSock.send(bytes('[%s] %s' % (ctime(), data.decode('utf-8')), 'utf-8')) #向客户端发送时间戳数据,必须发送字节数组

    tcpCliSock.close()  #关闭与客户端的连接
tcpSerSock.close()  #关闭服务器socket

客户端代码

#coding:utf-8

from socket import *

print("=====================TCP客户端=====================");

HOST = '127.0.0.1'  #服务器ip地址,等价于localhost
PORT = 21567  #通信端口号
BUFSIZ = 1024  #接收数据缓冲大小
ADDR = (HOST, PORT)

tcpCliSock = socket(AF_INET, SOCK_STREAM)  #创建客户端套接字
tcpCliSock.connect(ADDR)  #发起TCP连接

while True:
    data = input('> ')   #接收用户输入
    if not data:  #如果用户输入为空,直接回车就会发送"",""就是代表false
        break
    tcpCliSock.send(bytes(data, 'utf-8'))   #客户端发送消息,必须发送字节数组
    data = tcpCliSock.recv(BUFSIZ)   #接收回应消息,接收到的是字节数组
    if not data:   #如果接收服务器信息失败,或没有消息回应
        break
    print(data.decode('utf-8'))  #打印回应消息,或者str(data,"utf-8")

tcpCliSock.close() #关闭客户端socket

 

连接百度代码

import socket

# 服务器IP和端口
SERVER_IP = "14.215.177.39"
SERVER_PORT = 80

# 创建一个TCP套接字
client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

try:
    # 连接服务器
    client_socket.connect((SERVER_IP, SERVER_PORT))
    print("成功连接到服务器")

    # 构建HTTP请求
    request = "GET / HTTP/1.1\r\nHost: www.baidu.com\r\n\r\n"

    # 发送请求
    client_socket.sendall(request.encode())

    # 接收响应数据
    response = client_socket.recv(1024)
    print(f"收到服务器的响应:\n{response.decode()}")

finally:
    # 关闭套接字
    client_socket.close()
    print("客户端已关闭")

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张謹礧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值