学习内容:
1. python基础
2. HTML基础
3. 爬虫 bs4
4. socket
HTML部分:
- 需要安装的vscode扩展:
HTML Snippets(用于写HTML脚本时提示和自动补全):注意在右下角将语言模式改为HTML
live server(用于在本地访问在虚拟机上写的HTML脚本):注意点击右下角的golive启动,会显示默认使用的端口号。采用ip:端口号/xx/xx/xx.html访问,如果不能访问。可能防火墙不允许访问此端口号,可以在终端采用sudo ufw status查看允许访问的端口号,采用sudo ufw allow 端口号开启端口号的访问权限。
爬虫部分代码:
import requests
from time import sleep
from bs4 import BeautifulSoup
class robot():
def __init__(self):
self.url = "http://192.168.40.128:5500/src/html/site/index.html"
def getInfo(self):
try:
req = requests.get(self.url)
soup = BeautifulSoup(req.text, "html.parser")
layui_col_md12_list = soup.find_all("div", attrs={"class":"list-text"})
for info_tag in layui_col_md12_list:
# content = info_tag.find("div", attrs={"class":"content"})
print(info_tag.text)
print("--" * 100)
except:
pass
if __name__ == "__main__":
robot = robot()
robot.getInfo()
socket部分代码
import socket
#建立服务
sk = socket.socket()
#绑定IP
sk.bind(("127.0.0.1", 8080))
# 监听
sk.listen()
print("服务器开始运行啦。。。")
while True:
# 链接客户端
conn, addr = sk.accept()
# 接受数据
data = conn.recv(1024)
if data:
conn.send(b"HTTP/1.1 200 OK\r\n\r\n")
conn.send(bytes("你好啊",encoding="utf-8"))
break