爬虫
文章平均质量分 55
纯洁的小魔鬼
只有风暴才能击倒大树
展开
-
Python操作鼠标键盘和爬虫
pyautogui 是一个 Python 库,它允许你控制鼠标和键盘。这意味着你可以编写 Python 脚本来自动执行各种任务,例如点击按钮、输入文本、移动鼠标等。这个库非常适合用来编写自动化脚本来完成重复性的工作,比如网页表单填写、屏幕截图、GUI测试和爬虫等。原创 2024-05-15 17:26:07 · 1149 阅读 · 1 评论 -
ts视频文件的爬取与合并
一.爬取 ts 视频文件"""爬取 ts 视频文件"""import urllib.requestimport urllib.parse# 保存到的文件夹dir_path = "F:/ts_file/"# ts视频流的基础路径base_url = "https://ts_test/file_stream/"# 文件名的通用部分base_name = "ts_streem%s.ts"# 分析ts视频流文件名称规律, 比如后缀是按数字排序的, 依次爬取(具体问题具体分析)for原创 2021-08-04 10:34:38 · 6192 阅读 · 1 评论 -
BeautifulSoup网页解析器
1.获取网页源码信息主要利用urllib2,它比urllib可以设置超时参数import urllib2# 获取网页源码def get_html(url): # 设置失败次数 failureCount = 1 while True: try: # 允许重试次数 if failureCount &...原创 2019-05-26 02:48:39 · 3326 阅读 · 0 评论 -
Springboot上传excel并将表格数据导入或更新mySql数据库
本文主要描述,Springboot-mybatis框架下上传excel,并将之导入mysql数据库的过程,如果用户id已存在,则进行更新修改数据库中该项信息,由于用到的是前后端分离技术,这里记录的主要是后端java部分,通过与前端接口进行对接实现功能1.在pom.xml文件中导入注解,主要利用POI<dependency> <groupId>org.a...原创 2018-06-08 00:41:26 · 44551 阅读 · 30 评论