Datawhale-Django-Task1 笔记

最新推荐文章于 2023-08-21 18:13:01 发布

Pluto*

最新推荐文章于 2023-08-21 18:13:01 发布

阅读量154

点赞数

本文链接：https://blog.csdn.net/Ou_nei/article/details/117969785

版权

学习内容：

1. python基础

2. HTML基础

3. 爬虫 bs4

4. socket

HTML部分：

需要安装的vscode扩展：

HTML Snippets(用于写HTML脚本时提示和自动补全）:注意在右下角将语言模式改为HTML

live server(用于在本地访问在虚拟机上写的HTML脚本)：注意点击右下角的golive启动，会显示默认使用的端口号。采用ip:端口号/xx/xx/xx.html访问，如果不能访问。可能防火墙不允许访问此端口号，可以在终端采用sudo ufw status查看允许访问的端口号，采用sudo ufw allow 端口号开启端口号的访问权限。

爬虫部分代码：

import requests
from time import sleep
from bs4 import BeautifulSoup


class robot():
    def __init__(self):
        self.url = "http://192.168.40.128:5500/src/html/site/index.html"
    def getInfo(self):
        try:
            req = requests.get(self.url)
            soup = BeautifulSoup(req.text, "html.parser")
            
            layui_col_md12_list = soup.find_all("div", attrs={"class":"list-text"})
            for info_tag in layui_col_md12_list:
                # content = info_tag.find("div", attrs={"class":"content"})
                print(info_tag.text)
                print("--" * 100)
        except:
            pass

if __name__ == "__main__":
    robot = robot()
    robot.getInfo()

socket部分代码

import socket

#建立服务
sk = socket.socket()
#绑定IP
sk.bind(("127.0.0.1", 8080))
# 监听
sk.listen()
print("服务器开始运行啦。。。")
while True:
    # 链接客户端
    conn, addr = sk.accept()
    # 接受数据
    data = conn.recv(1024)
    if data:
        conn.send(b"HTTP/1.1 200 OK\r\n\r\n")
        conn.send(bytes("你好啊",encoding="utf-8"))
        break