
python
文章平均质量分 56
牛马程序员2025
计算机/统计学硕士(研究方向:网络爬虫/机器学习)
Python爬虫 | Selenium/Scrapy | 数据清洗 | 可视化分析 | 学术自动化
擅长数据采集、脚本开发
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
中国高校数据采集与可视化分析系统-有偿获取(白嫖勿扰)
本项目是一个完整的数据采集与可视化分析系统,专注于中国高校数据的采集、存储和多维度分析展示。系统通过爬虫从上海软科大学排名网站获取最新的高校排名数据,并通过直观的可视化界面展示各类统计分析结果,帮助用户快速了解中国高校的分布情况、类型占比、评分分布等关键信息。【软科排名】2025年最新软科中国大学排名|中国最好大学排名本项目成功实现了从数据采集到可视化展示的完整流程,为用户提供了直观了解中国高校分布情况的工具。系统架构清晰,代码实现规范,具有良好的可扩展性和可维护性。原创 2025-06-09 20:46:22 · 182 阅读 · 0 评论 -
Flask + OpenResty 部署操作手册
本文档详细介绍了Flask应用的标准部署流程。主要包括:1)服务器准备(Ubuntu20.04+系统要求及目录结构);2)部署步骤(Flask应用启动、OpenResty配置、防火墙设置);3)服务验证(状态检查、端口监听测试);4)日常维护(日志查看、服务管理);5)故障处理(常见问题排查和应急恢复方案)。文档还提供了安全建议(HTTPS配置、IP访问限制)和备份方案。部署时需按手册章节逐步执行,确保服务正常运行。原创 2025-06-09 16:41:23 · 185 阅读 · 0 评论 -
基于Django框架的高校实验室管理系统设计与实现----完整源码私信有偿获取
高校实验室管理系统是一个基于Django框架开发的综合性平台,旨在提升实验室管理效率,优化资源配置,并简化预约流程。系统包含用户管理、实验室资源管理、预约管理、设备管理、数据统计与分析、通知与消息系统等六大功能模块,支持多角色用户系统,包括管理员、教师、学生和实验室管理员。技术架构采用HTML5/CSS3/JavaScript、Bootstrap、jQuery/AJAX等前端技术,以及Django框架、PostgreSQL/MySQL数据库等后端技术。系统特色包括响应式设计、权限精细控制、智能冲突检测、数据原创 2025-05-15 14:52:57 · 561 阅读 · 0 评论 -
心血管健康系统
管理员界面:仪表盘:用户管理:数据集管理:模型监控:用户界面:原创 2025-02-23 11:14:11 · 363 阅读 · 0 评论 -
Python突破滑块验证-最简单高效的反反爬策略
background = page.ele('x://*[@id="oriImg"]').src() # 背景图。block = page.ele('x://*[@id="cutImg"]').src() # 滑块图。page.get("https://cszg.mca.gov.cn/...") # 目标网站。- **DrissionPage**:相比Selenium更轻量,支持直接操作浏览器。- **ddddocr**:准确率高达95%的验证码识别库,支持滑块匹配。原创 2025-02-08 00:10:10 · 1189 阅读 · 0 评论 -
python坦克大战
【代码】python坦克大战。原创 2024-05-21 13:58:47 · 2530 阅读 · 0 评论 -
python消消乐
游戏的基本规则是玩家通过交换相邻的宝石,形成三个或以上的同色宝石连线,以消除宝石并获得分数。原创 2024-05-18 16:55:21 · 934 阅读 · 0 评论 -
京东商品信息以及评价爬虫获取
1:输入搜索的关键词:对应页数:部分代码截图商品基本信息数据表:商品评价信息数据表:原创 2024-02-14 18:58:04 · 971 阅读 · 0 评论 -
爬虫唐诗三百首
接下来,我们调用get_poem()函数来爬取每首诗的内容,并将其存储在本地的txt文件中。然后,我们使用Selenium的find_element()方法来获取诗歌内容的文本,并对其进行处理和存储。这样可以提高效率,并且不会干扰我们的工作。通过这个示例,我们可以看到如何使用Python编程语言和Selenium库来构建一个简单的网络爬虫,从古诗文网上获取唐诗三百首的全集。然后,我们使用Selenium库来模拟浏览器行为,访问古诗文网的特定页面,获取诗歌的内容,并将其存储到本地的txt文件中。原创 2024-02-13 19:34:53 · 1290 阅读 · 0 评论 -
微博信息获取以及预处理
源码有偿获取,需要请私信作者。原创 2024-01-12 15:06:47 · 746 阅读 · 0 评论 -
批量文件夹命名
img_directory = "文件所在文件夹路径"csv_file_path = "csv文件绝对路径"print("文件数量与新名称数量不匹配")print("路径不是文件夹")print("路径不是文件夹")print("路径不存在")print("路径不存在")# 检查文件数量和新名称数量是否匹配。print("文件名修改完成")# 构建新的文件路径。# 遍历目录下的所有文件。# 检查路径是否为目录。# 检查路径是否为目录。# 检查路径是否存在。# 初始化文件名列表。# 检查路径是否存在。原创 2023-12-25 16:07:05 · 387 阅读 · 0 评论 -
python贪吃蛇
【代码】python贪吃蛇。原创 2023-12-06 18:56:26 · 355 阅读 · 0 评论 -
豆瓣电影简介查询器
豆瓣电影简介查询器,很牛马很简单!很好玩!!!原创 2023-12-05 16:03:18 · 501 阅读 · 0 评论 -
微博通用爬虫代码开源分享
通用微博爬虫代码,粘贴过去安装软件包运行即可使用原创 2023-10-28 16:29:45 · 782 阅读 · 0 评论 -
Python人脸识别门禁系统(完整代码和资源可获取)
基于Python的人脸识别门禁系统是一种利用Python编程语言和相关的图像处理库、人脸识别库等技术实现的门禁系统。它可以通过摄像头捕捉人脸图像,使用人脸识别算法来识别人脸,进而判断该人是否有权限进入某个区域或设备。该系统可以实现自动化门禁控制,提高门禁管理的安全性和便利性。该系统的主要功能包括人脸图像的采集、预处理、特征提取、人脸识别、门禁控制等。其中,人脸图像采集可以通过摄像头进行实时采集;预处理包括图像的缩放、裁剪、灰度化等处理;特征提取则是从图像中提取出有用的特征信息,如人脸轮廓、眼睛、嘴巴等;原创 2023-07-15 18:23:29 · 8566 阅读 · 2 评论