用于测试设备是否上线,以及上线后自动检测各传感器的状态,并反馈结果。
1,输入设备id
2,自动获取网页数据进行检查得出结果
3,在查看视频直播,和图片上传是否正常
4,记录结果在测下一次
用python爬虫爬取数据
python爬虫要用到requests库
使用requests.get(url)方法访问该URL地址网页,会返回一个响应
再用response.text()方法,将响应的结果转换为文本形式。
得到响应的数据后可以用lxml库来解析数据,获得想要的结果
使用tree.xpath('//div[@class="hd"]/a/span[@class="title"][1]/text()')方法来解析数据,括号中表示匹配class="hd"的div标签下面的a标签下面的class="title"的第一个span标签,并将数据存储为文本返回。
存储数据到Excel要用到openpyxl库
Workbook()方法用来创建工作簿对象,
用sheet=workbook.active来获取活动的工作表
设置表头 sheet['A1']='电影名'
用sheet.cell(row,column,value)来设置对应行列格子的值。
import requests
from lxml import etree
from openpyxl import Workbook
# 创建工作簿对象
workbook = Workbook()
# 获取默认的活动工作表
sheet = workbook.active
# 设置表头
sheet['B1'] = '电影名称'
sheet['C1'] = '评分'
url = f'https://movie.douban.com/top250?start=0&filter='
headers = {'User-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'}
response = requests.get(url,headers = headers)
html = response.text
# 使用lxml解析HTML
tree = etree.HTML(html)
# 提取电影标题和评分
titles = tree.xpath('//div[@class="hd"]/a/span[@class="title"][1]/text()')
scores = tree.xpath('//span[@class="rating_num"]/text()')
for i in range(len(titles)):
row = i + 2 # 数据从第二行开始写入,因为第一行是表头
sheet.cell(row=row, column=1, value=row-1)
sheet.cell(row=row, column=2, value=titles[i]) # 电影名称
sheet.cell(row=row, column=3, value=scores[i]) # 评分
# 保存文件
workbook.save('豆瓣电影Top250.xlsx')
这段代码为获取top250的前25个电影的排名,将结果存入Excel表格中