野生的狒狒-CSDN博客

原创 NumPy 舍入小数、对数、求和和乘积运算详解

NumPy提供了多种数值处理功能：1. 舍入操作包括trunc()/fix()截断、around()四舍五入、floor()向下取整和ceil()向上取整；2. 对数运算支持log2()、log10()和log()，还能通过frompyfunc()实现任意底数对数；3. 求和与乘积计算有sum()/cumsum()和prod()/cumprod()，均支持沿轴操作。这些功能为科学计算提供了强大的数值处理工具。

2025-06-10 17:04:06 576

原创集成学习常用组合策略：让多个模型“合作”得更好

本文介绍了集成学习中四种常见的组合策略：回归任务的平均法和加权平均法，分类任务的投票法和加权投票法。平均法和投票法简单直接，对所有学习器一视同仁；加权方法则通过分配不同权重来体现学习器的重要性差异。文章提供了Python代码示例，展示了如何用scikit-learn实现这些策略，并比较了它们的性能表现。选择合适的组合策略需考虑模型性能差异、数据噪声等因素，在实践中应通过实验确定最优策略。

2025-05-26 23:27:53 789

原创 3D Gaussian Splatting 查看工具 splatviz

针对3DGaussian Splatting工具兼容性问题，本文推荐使用Splatviz作为替代方案。该Python项目可在本地快速查看ply文件，支持训练过程监控、参数调试和视频生成功能。安装时需适配CUDA 12.6环境，建议复用已有的Gaussian-Splatting conda环境并手动安装依赖模块。运行中可能出现的GL库错误可通过重装驱动或conda安装gcc-12解决。相比原生的SIBRViewer对显卡的高要求，Splatviz在P104-100等低算力显卡上表现更优，且避免了Web方案在老

2025-05-26 23:26:25 1220

转载 VitePress 集成 Twikoo 评论

Twikoo 是一个简洁、安全、免费的静态网站评论系统。主要特点：免费搭建，部署简单，功能很完善，隐私护安全，通知发邮件，管理有内嵌，总之免费又方便关于后端部署，大家可以看官网，或者这篇 VitePress 资源汇总 - 使用 Twikoo 评论系统。推荐使用 (免费，需配置域名加速访问) 或者（免费）。这篇主要讲 Vitepress 前端如何集成。 2. 初始化 twikoo 组件

2025-05-26 23:24:16 76

原创基于CARLA/ROS的多传感器融合感知系统实战教程（附完整代码）

本文介绍了一个基于CARLA仿真平台和ROS系统的多传感器融合自动驾驶感知系统。通过整合摄像头与激光雷达数据，解决了单一传感器的局限性。系统实现了时空同步、联合标定、3D目标检测和环境语义理解等核心功能，包含数据采集、预处理、点云-图像标定、模型训练及融合算法开发等完整流程。文章详细说明了环境配置、传感器同步策略、空间变换实现以及两种融合方式（前融合与后融合），并提供了性能评估指标和优化方向。该系统在仿真环境中实现了高精度目标检测，处理延迟低于100ms，为自动驾驶感知系统开发提供了完整的参考方案。

2025-05-26 23:22:13 550

原创用 Tarjan 算法求解有向图的强连通分量

摘要：Tarjan算法是解决有向图强连通分量(SCC)问题的高效算法，通过单次DFS遍历即可识别所有SCC。该算法利用发现时间、最低访问时间等概念，结合栈结构在线性时间内完成SCC检测。其核心创新在于巧妙地将节点访问顺序与回溯机制结合，准确识别图中的循环依赖结构。该算法不仅具有O(V+E)的优异时间复杂度，还衍生出图的缩点技术和2-SAT问题求解等重要应用，展现了处理复杂依赖关系的强大能力，成为图论算法中的经典范例。

2025-05-26 23:21:13 1064

原创 DevEco重大更新快来体验吧

HarmonyOS API 17正式发布，DevEco新增多项重要特性。本次更新支持创建API 17应用，并首次提供折叠手机和2in1设备模拟器支持。重点改进包括：新增34个ACL权限管理功能（其中2个为新权限），实现自动签名申请；优化WebView调试功能，支持自动监听进程转发端口；系统能力增强，新增窗口尺寸指定、AREngine深度估计、2in1设备适配优化等功能；引入FileManagerServiceKit提供文件管理服务。这些改进显著提升了开发效率和系统灵活性。

2025-05-26 23:20:03 957

原创鸿蒙next 定位开发全场景实践

本文深入解析鸿蒙next位置服务开发，介绍了GNSS与网络定位两种核心方式，并详细讲解了四种典型场景的实现方法：当前位置定位通过getCurrentLocation()获取瞬时坐标；实时定位通过on('locationChange')追踪运动轨迹；后台定位结合长时任务实现持续更新；历史定位利用getLastLocation()获取缓存数据。文章还提供了常见问题排查方案，如定位偏差处理、权限检查等，并给出性能优化建议，包括动态调整定位策略、及时释放资源等

2025-05-25 22:18:18 1070

原创 ES查询优化随记: 多路向量查询 & KNN IO排查 & 高效Filter使用

文章分享了Elasticsearch 8.13版本在向量搜索实践中的经验。主要介绍了三种多Query向量查询方案：Script平均查询、向量Script循环查询和KNN查询，并对比了性能差异。针对KNN查询导致的IO过高问题，提出了优化图大小和预加载两种解决方案。同时分析了Filter的三种使用方式（prefilter、postfilter和must）对查询效率的影响，其中prefilter效率最高。这些经验对于使用ES构建RAG系统及处理向量搜索场景具有实用参考价值。

2025-05-25 22:10:47 903

原创传统异步回调 vs C++20协程

《传统异步回调 vs C++20协程》对比分析：传统异步回调实现简单但易陷入"回调地狱"，代码可读性差、错误处理困难；C++20协程提供线性编程风格，避免嵌套回调，简化错误处理，但调试复杂且学习曲线陡。性能测试表明协程在高并发和IO密集型任务中表现更优，上下文切换开销小。协程适合复杂异步场景如网络开发，而简单场景仍可使用回调。需根据项目需求和团队水平选择合适方案。

2025-05-25 22:09:30 428

原创玩转 C++11 多线程：让你的程序飞起来的 std::thread 终极指南

本文介绍了C++11中std::thread的多线程编程技术。主要内容包括：1) std::thread的基本创建方式，对比传统多线程API的不足；2) 线程参数传递技巧，包括按值传递、引用传递和使用std::bind；3) 线程同步机制，如互斥锁(std::mutex)、RAII风格的锁管理(std::lock_guard)、灵活锁(std::unique_lock)和条件变量；4) 线程池的实现与优化，减少线程创建销毁开销；5) 性能优化与调试技巧，如减少线程切换、合理设置线程数量、避免虚假共享等。

2025-05-25 20:05:38 690

原创基于Scikit-learn与Flask的医疗AI糖尿病预测系统开发实战

本文基于MIMIC-III医疗数据集，构建了符合医疗标准的糖尿病预测AI系统。系统采用Python技术栈，通过XGBoost模型实现高精度预测，并集成FHIR和DICOM医疗标准。项目涵盖数据治理、特征工程、模型训练、API服务开发全流程，重点解决了医疗数据的隐私合规、异常值处理等特殊问题。系统部署采用Flask+Gunicorn架构，支持临床决策界面，并通过SHAP值增强模型可解释性。测试显示系统AUC达0.85以上，已在医院试运行并显著提升诊断效率。项目为医疗AI落地提供了完整的技术范式，未来可扩展至多

2025-05-25 19:56:23 830

原创 QT入门概述

是一个跨平台的C++应用程序开发框架具有短平快的优秀特质: 投资少、周期短、见效快、效益高几乎支持所有的平台, 可用于桌面程序开发以及嵌入式开发有属于自己的事件处理机制可以搞效率的开发基于窗口的应用程序。Qt是标准 C++ 的扩展, C++的语法在Qt中都是支持的良好封装机制使得 Qt 的模块化程度非常高，可重用性较好，可以快速上手。Qt 提供了一种称为 signals/slots 的安全类型来替代 callback（回调函数），这使得各个元件之间的协同工作变得十分简单。

2024-07-18 18:46:28 945

原创数据库备份与恢复

数据迁移（data migration）是指选择、准备、提取和转换数据，并将数据从一个计算机存储系统永久地传输到另一个计算机存储系统的过程。此外，验证迁移数据的完整性和退役原来旧的数据存储，也被认为是整个数据迁移过程的一部分。数据库迁移的原因是多样的，包括服务器或存储设备更换、维护或升级，应用程序迁移，网站集成，灾难恢复和数据中心迁移。根据不同的需求可能要采取不同的迁移方案，但总体来讲，MySQL 数据迁移方案大致可以分为物理迁移和逻辑迁移两类。通常以尽可能自动化。

2024-07-18 18:45:40 1563

原创深入Django：用户认证与权限控制实战指南

要自定义登录或注册视图，可以创建一个类视图并定义。

2024-07-18 18:44:02 2136

原创 python基础环境

刚开始接触并学习一门开发语言，带着的想法，其实也挺有好处的：我并不是所有的东西都知道，但是代码跑起来了。但是时间久了，还是带着这种想法，可能就会遇到一些棘手的问题。比如电脑上不知不觉已经安装了多个python版本，python3.8/3.10/3.11，甚至一些软件中也集成有python解释器；那么我编写的python代码，到底是使用哪个解释器在执行？我通过pip包管理工具安装的依赖包到底在那个地方？为什么已经安装了依赖包，代码提示还是缺少依赖呢？

2024-07-17 16:10:29 1223

原创 Python 调整PDF页面尺寸大小

加载原始PDF文档originalPdf.LoadFromFile("报告.pdf")# 创建新PDF文档#创建PdfUnitConvertor类的对象，用于转换不同的测量单位# 将自定义尺寸的单位由毫米转换为点数（磅）# 创建一个自定义宽度和高度的SizeF对象# 遍历原始PDF中的页面# 在新PDF文档中添加自定义尺寸(180*225mm)的页面# 创建PdfTextLayout实例# 将文本布局设置为单页，以确保内容能够正确适应页面大小。

2024-07-17 16:08:54 1545

原创 Fastapi集成SSE服务后端主动推送消息到前端

SSE（Server-Sent Events）是一种允许服务器向客户端浏览器推送信息的技术。它是 HTML5 的一部分，专门用于建立一个单向的从服务器到客户端的通信连接。SSE的使用场景非常广泛，包括实时消息推送、实时通知更新等。严格地说，HTTP 无法做到服务器主动推送信息。但是，有一种变通方法，就是服务器向客户端声明，接下来要发送的是流信息（streaming）。也就是说，发送的不是一次性的数据包，而是一个数据流，会连续不断地发送过来。

2024-07-17 16:07:38 557

原创 ORM基础

ORM是MVC框架中的重要的部分。它实现了数据模型与数据库的解耦，即数据模型的设计不需要依赖于特定的数据库，通过简单的配置就可以轻松更换数据库，这极大的减轻了开发人员的工作量。dj.sqlite3是django中的集成数据库，在settings中配置好的，适合测试环境用【适用于数据量小的时候】1.创建对象映射关系，即创建模型类，其实就是在app下的models.py中，以类和属性的形式定义表的字段。2.配置数据库连接，并且有了关系映射关系，这个时候就可以通过命令在数据库中生成具体表了。

2024-06-24 15:58:43 579

转载超越datetime：Arrow，Python中的日期时间管理大师

Arrow是一个Python库，它提供了一种合理且对人类友好的方法来创建、操作、格式化和转换日期、时间和时间戳。它实现了对datetime类型的更新，填补了功能上的空白，提供了一个智能的模块API，支持许多常见的创建场景。简单来说，它可以帮助您使用更少的导入和更少的代码来处理日期和时间。Arrow以时间之箭命名，并且受到moment.js和requests的极大启发。

2024-06-24 15:56:46 251

原创数据剑舞，图表如潮！Matplotlib傲视数据可视化江湖

在代码的世界中，隐藏着一座神秘而神奇的画图殿堂，它就是Matplotlib。这座殿堂矗立在数据的海洋中，每一行代码都是一笔神奇的咒语，让数据在图像之间舞动，展现出无限可能。Matplotlib的大门上镶嵌着闪烁的彩虹宝石，每当有开发者走近，便散发出五彩斑斓的光芒，仿佛在诉说着这里的神秘。而在宫殿深处，站立着一座巨大的绘图笔，它拥有操控数据之力，将每一次绘图都变成了一场奇妙的冒险。当你走进Matplotlib的殿堂，就像踏入了一个充满魔力的世界，数据的颜色与形状便开始跃然纸上，呈现出无限可能的未来。

2024-06-23 23:31:14 579

原创【算法-二分查找】实现过程、C++代码示例以及实际应用

也称为折半查找，是一个在已排序数组中查找特定元素的搜索算法。它的工作原理是将有序数组分成两半，然后检查目标值是在左半部分还是右半部分，然后在所选择的那部分中继续查找。这一过程将不断地重复，直到找到目标值或确定目标值不在数组中。

2024-06-23 23:28:30 369

转载 Java中static关键字

在《java编程思想》里有这么一段话:"static就是没有this的方法，在static方法内部不能调用非静态方法，反过来可以。而且可以在不创建类对象的情况下，仅通过类本身来调用static方法。这实际上就是static方法的主要用途。这句话说明了static方法的基本用途，即：在没有创建对象的情况下完成方法的调用显然staitc关键字修饰的方法或变量不需要依赖对象去访问，只要类被加载，就可以通过类名进行访问。static可以修饰成员变量和成员方法，通过编写static代码块也可优化程序性能。

2024-06-23 23:26:08 109

原创 python中包管理工具pip以及虚拟环境venv的使用

venv是python自带的环境管理工具（好像是3.7版本后才引入的），它的作用是创建虚拟环境，以便更好地管理每个项目中的包。最直观的好处就是用pyinstaller打包时不会引入很多不相关的包导致生成的可执行文件体积过大了。而且创建虚拟环境后vscode也能自动识别到，这就很方便了。绝大多数用户使用pycharm时使用的虚拟环境就是它。然后管理员权限运行power shell，输入命令。允许本地（本机）脚本无需数字签名运行。当前现用执行策略是否是。

2024-06-22 22:33:30 627

原创按规则解析并替换字符串中的变量及函数

1、按照一定规则解析字符串中的函数、变量表达式，并替换这些表达式。这些函数表达式可能包含其它函数表达式，即支持函数嵌套__${

2024-06-22 22:31:55 352

原创 Python+自动化测试生成HTML报告

先把文件放在python路径下的lib里面.

2024-06-22 15:19:29 443

原创 Python装饰器（一次搞清楚）

这样才能将参数传递给被装饰的函数。

2024-06-19 21:31:11 2488 1

原创 python接口自动化之excel读取测试数据

range（起始值，终点值） range（2,5）------ [2,3,4]# 找到测试数据所在的表单注：代码里面的表单名称要与Excel里面的表单名称一致。# 将datas转换成字典。excel中有用例名称、url、请求方式和请求参数。# 获取每一行的请求数据、地址、请求方法。# 单独获取某个单元格的值，第二行第二列。# 加载测试文件此处存放的是本地路径。# for循环实现遍历---遍历行号。# 发送一次接口请求。# 拿到第一行的行号。

2024-06-19 21:30:27 668

原创 Python异步编程高并发执行爬虫采集，用回调函数解析响应

本例中，异步耗时的总时长与访问google.com超时时长相同，那么意味着，如果协程中如果有1个是耗时很长的任务，那么主线程还将被阻塞，异步解决不了这个问题，这时耗时协程应该拿出来，用子线程、或者子进程来执行。通常的编程，如果有4个任务，采用同步编程模式，4个任务是按顺序执行的，分别用时:10s，7s，5s，6s，共耗时28s;现在，采用Asyncio异步编程，以并发的运行方式，向多个网站同时发送request, 总耗时，应该是用时最长那个协程的用时。，相比同步编程方式，耗时减少了1半。

2024-06-19 21:29:07 2215

原创各个数据类型的内置方法（字符串和列表）

数字类型主要就是用来做数学运算与比较运算，因此数字类型除了与运算符结合使用之外，并无需要掌握的内置方法。

2024-06-18 06:51:05 358

原创 Python 中如何向列表或数组添加元素

编程中的数组是一个有序的项目集合，所有的项目都需要是相同的数据类型。然而，与其它编程语言不同，数组在 Python 中不是一个内置的数据结构。Python 使用列表取代传统的数组。列表本质上是动态数组，是 Python 中最常见的和最强大的数据结构之一。你可以把它们想象成有序的容器。它们将同类相关的数据存储和组织在一起。存储在一个列表中的元素可以是任何数据类型。可以有整数列表、浮点数列表、字符串列表，以及任何其它内置 Python 数据类型的列表。

2024-06-18 06:47:01 3384

原创高效Python-提高数据处理效率的迫切需要

本书的主题是如何从Python中获得高性能，只有从数据和算法需求以及计算架构等更广阔的角度来考虑，才能设计出高效的代码。帮助你理解CPU设计、GPU、存储替代方案、网络协议和云架构以及其他系统考虑因素（图1.4）的影响，从而为提高Python代码的性能做出正确的决策。无论是单台计算机、支持GPU的计算机、集群还是云环境，本书都将帮助您评估计算架构的优缺点，并实施必要的更改以充分利用其优势。

2024-06-18 06:44:27 1200

原创掌握Python面向对象编程的关键：深度探索类与对象

在Python中，类是一种定义新数据类型的方式，它在一个逻辑框架内封装了数据（属性）和操作数据的函数（方法）。这个概念帮助我们建立更为复杂的数据模型，模拟现实世界中的各种对象和它们的交互方式。数据封装：类中的属性保存了对象的状态。这些属性通常在__init__方法中初始化，并可以通过对象的生命周期进行访问和修改。封装保证了数据的完整性和一致性。行为抽象：类中定义的方法描述了对象可以执行的操作。这些方法可以访问和修改对象的状态，或者与其他对象进行交互。继承。

2024-06-16 12:36:26 760

原创 Python控制流程盘点及高级用法、神秘技巧大揭秘！

这个列表解析的过程可以理解为：对于每个在 `range(10)` 中的 `x`，计算 `x` 的平方，然后将结果添加到列表中。生成器对象是一个可迭代的对象，它在每次迭代时都会生成新的值，而不是一次性生成所有的值。许多人可能不知道，`for`循环和`while`循环可以有一个可选的`else`子句，它在循环正常结束时执行。这个特性在很多情况下都非常有用，比如我们在循环中搜索一个元素，如果找到了就通过`break`语句终止循环，如果循环正常结束还没有找到，就执行`else`子句中的代码。

2024-06-16 12:35:40 876

原创 Python Django Web开发实战

Django是一个非常强大的Python Web开发框架，它以"快速开发"和"干净、实用的设计"为设计宗旨。本文将从Django的基本概念开始，逐渐引导大家理解如何使用Django构建复杂的web应用程序。

2024-06-16 12:35:01 856

原创【pandas小技巧】--随机挑选子集

在pandas中，如果遇到数据量特别大的情况，随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据，从而更好地进行数据分析和决策。本篇介绍一种pandas挑选子集的方式，以及子集在机器学习中常用的一个场景。

2024-06-15 20:43:55 1173

原创 Python中对open读取文件内容时的mode模式解析

当读写文件采用'b'的模式时，要求必须以二进制形式读写，在python2中，字符串必须为str字符串，python3中必须为byte字符串；只读模式，open函数中mode参数的默认模式，文件不存在的话，报FileNotFoundError(python2是IOError)；这里我们主要关心一下'r', 'w', 'a', 'r+', 'w+', 'a+', 'x'，很多人容易混淆不同模式的读写操作。创建文件并写操作，操作必须是不存在的文件，如果操作的文件已存在，则报错FileExistsError。

2024-06-15 20:41:09 1551

原创 Conda 命令深入指南

Conda 是一个功能强大的包管理系统，允许您为不同的项目创建和管理隔离的环境，从而更轻松地处理不同的依赖项集。1。

2024-06-15 20:39:22 772

原创多次复制Excel符合要求的数据行：Python批量实现

如下图所示，可以看到结果文件中，符合我们要求的行，已经复制了。知道了需求，我们就可以开始代码的书写。函数，读取我们需要加以处理的文件，并随后将其中的数据存储在名为。中（这样相当于对于我们需要的行，其自身再加上我们刚刚复制的那。其中，如下图所示，这一文件中有一列（也就是。在指定的范围内，那么就将这一行复制一下（相当于新生成一个。首先，我们来明确一下本文的具体需求。首先，我们需要导入所需的库；此时，我们即可基于我们的实际需求，对变量。函数，将处理之后的结果数据保存为一个新的。接下来，我们再创建一个空的。

2024-06-14 08:49:23 432

原创 selenium之3大等待方式

1、通过设定的时长等待页面元素加载完成，再执行下面的代码，如果超过设定时间还未加载完成，则继续执行下面的代码（注意：在设定时间内加载完成则立即执行下面的代码）；本例中，设置的等待时长为10秒，但这10秒并非一个固定时间，并不影响脚本执行速度；其次，隐式等待对整个driver的周期都起作用，因此只需要设置一次即可。即sleep()方法，由python中的time模块提供，强制让代码等待xxx时间，无论前面的代码是否执行完成或者还未完成，都必须等待设定的时间。4、until方法入参中常用的method。

2024-06-14 08:48:26 403

DeepSeek 智能办公升级指南

二、DeepSeek的核心功能 1. 模型训练与调优 DeepSeek提供强大的模型训练功能，支持多种深度学习框架，如TensorFlow、PyTorch等。用户通过简单配置，就能快速启动模型训练，还能利用DeepSeek的自动调参功能优化模型性能。 - 实操指南： - 登录DeepSeek平台，选择“模型训练”模块。 - 上传数据集，选择合适的模型架构，如BERT、ResNet等。 - 设置训练参数，如学习率、批次大小等，启动训练。 - 使用DeepSeek的自动调参功能，优化模型超参数。 2. 预训练模型库 DeepSeek内置丰富的预训练模型，涵盖NLP、CV等多个领域。用户可直接调用这些模型进行推理或微调，节省大量时间和计算资源。 - 实操指南： - 在DeepSeek的“模型库”中，搜索需要的预训练模型，如GPT-3、YOLOv5等。 - 下载模型并加载到项目中。 - 若有特定任务需求，可对模型进行微调，以适应数据集。 3. 模型部署与管理 DeepSeek支持一键式模型部署，用户能将训练好的模型快速部署到云端或本地服务器，并通过API接口调用。此外，DeepSeek还提供模型版本管理功能，方便用户跟踪和管理不同版本的模型。 - 实操指南： - 在DeepSeek的“模型部署”模块中，选择训练好的模型。 - 设置部署环境，如CPU/GPU、内存大小等，点击“部署”。 - 获取API接口，集成到应用中。 4. 数据处理与增强 DeepSeek提供强大的数据处理工具，支持数据清洗、标注、增强等功能。用户通过这些工具，能快速准备高质量的训练数据，提升模型性能。 - 实操指南： - 在DeepSeek的“数据处理”模块中，上传原始数据。 - 使用DeepSeek的数据清洗工具，去除噪声数据。

2025-05-28

DeepSeek 教育智能应用集

2025-05-28

DeepSeek 图像处理宝典

一、DeepSeek是什么 DeepSeek是一款集成多种AI技术的开发平台，旨在为用户提供高效、便捷的AI模型训练、部署和应用服务。它支持自然语言处理（NLP）、计算机视觉（CV）、语音识别等多个领域的任务，还提供丰富的预训练模型和工具，帮助用户快速构建和优化AI应用。二、DeepSeek的核心功能 1. 模型训练与调优 DeepSeek提供强大的模型训练功能，支持多种深度学习框架，如TensorFlow、PyTorch等。用户通过简单配置，就能快速启动模型训练，还能利用DeepSeek的自动调参功能优化模型性能。 - 实操指南： - 登录DeepSeek平台，选择“模型训练”模块。 - 上传数据集，选择合适的模型架构，如BERT、ResNet等。 - 设置训练参数，如学习率、批次大小等，启动训练。 - 使用DeepSeek的自动调参功能，优化模型超参数。 2. 预训练模型库 DeepSeek内置丰富的预训练模型，涵盖NLP、CV等多个领域。用户可直接调用这些模型进行推理或微调，节省大量时间和计算资源。 - 实操指南： - 在DeepSeek的“模型库”中，搜索需要的预训练模型，如GPT-3、YOLOv5等。 - 下载模型并加载到项目中。 - 若有特定任务需求，可对模型进行微调，以适应数据集。 3. 模型部署与管理 DeepSeek支持一键式模型部署，用户能将训练好的模型快速部署到云端或本地服务器，并通过API接口调用。此外，DeepSeek还提供模型版本管理功能，方便用户跟踪和管理不同版本的模型。

2025-05-28

DeepSeek 多模态应用快线

2025-05-28

重写改进Java爬虫框架ScriptSpider-master

爬虫网络爬虫按照系统结构和实现技术，大致可以分为以下几种类型：通用网络爬虫（General Purpose Web Crawler）、聚焦网络爬虫（Focused Web Crawler）、增量式网络爬虫（Incremental Web Crawler）、深层网络爬虫（Deep Web Crawler）。实际的网络爬虫系统通常是几种爬虫技术相结合实现的。通用网络爬虫通用网络爬虫又称全网爬虫（Scalable Web Crawler），爬行对象从一些种子URL扩充到整个Web，主要为门户站点搜索引擎和大型Web服务提供商采集数据。由于商业原因，它们的技术细节很少公布出来。这类网络爬虫的爬行范围和数量巨大，对于爬行速度和存储空间要求较高，对于爬行页面的顺序要求相对较低，同时由于待刷新的页面太多，通常采用并行工作方式，但需要较长时间才能刷新一次页面。虽然存在一定缺陷，通用网络爬虫适用于为搜索引擎搜索广泛的主题，有较强的应用价值。通用网络爬虫的结构大致可以分为页面爬行模块、页面分析模块、链接过滤模块、页面数据库、URL队列、初始URL集合几个部分。

2024-09-07

智能GPT图书管理系统,全局异常拦截器，登录校验拦截器，Echarts展示借阅量，可添加爬虫功能获取图书数据.zip

2024-09-07

这是一个学习爬虫的仓库

2024-09-07

一个自动管理ChromiumDriver版本的，基于Selenium开发的自动化测试爬虫框架

2024-09-07

一个轻量级网络多线程爬虫框架

2024-09-07

一个轻量级的基于事件分发的爬虫框架

2024-09-07

一个简单的超快速异步爬虫框架.zip

2024-09-07

它提供简单灵活的API，只需少量代码即可实现一个爬虫

2024-09-07

它是一个先进的网络爬虫工具，利用 BeautifulSoup 和机器学习技术实现高效的数据提取和分析

2024-09-07

使用爬虫+数据分析+图形化操作, 使得学生的做题情况显示到web网页上

2024-09-07

实战多种网站、电商数据爬虫.zip

2024-09-07

爬虫管理系统，支持集群，弹性伸缩支持运行feapder、scrapy、selenium、platwright等各种框架及脚本

2024-09-07

地铁大数据客流分析系统.zip

2024-09-07

不懂数据采集技术，也可轻松采集海量数据.zip

2024-09-07

城市房价分析系统-爬虫,使用scrapy框架实现.zip

2024-09-07

一个Qt开发的可以替代爬虫的网页数据采集软件

2024-09-07

DeepSeek 知识服务创新手册

四、DeepSeek的实用场景 1. 智能客服 DeepSeek的自然语言处理能力可用于构建智能客服系统。通过训练对话模型，企业能实现自动化的客户服务，提升响应速度和客户满意度。 - 实操指南： - 使用DeepSeek的预训练对话模型，如GPT-3。 - 微调模型以适应企业的特定需求。 - 部署模型并通过API集成到客服系统中。 2. 图像识别与分类 DeepSeek的计算机视觉功能可应用于图像识别与分类任务。例如在医疗领域，可用于自动识别医学影像中的病变区域。 - 实操指南： - 使用DeepSeek的预训练图像模型，如ResNet。 - 使用医学影像数据集进行微调。 - 部署模型并通过API集成到医疗诊断系统中。 3. 英语培训场景应用在英语培训中，DeepSeek可以助力打造智能学习辅助系统。通过自然语言处理技术，实现奇速英语智能口语评测，精准分析学员发音的准确性、流利度等，给予针对性反馈。利用文本生成功能，为学员自动生成个性化的练习题，涵盖语法、词汇、阅读理解等多种题型。比如在词汇学习环节，根据学员的学习进度和薄弱点，生成包含特定词汇的短文，要求学员填空、改写或翻译，强化词汇记忆与运用。同时，借助语音识别和合成技术，构建虚拟对话场景，学员能与虚拟角色进行英语对话练习，提升口语表达能力。还能通过数据分析，为教师提供学员学习情况报告，帮助教师优化教学策略。 - 实操指南： -英语学习：奇速英语时文阅读小程序/APP 1.海量万篇+每天更新 2.个性化阅读（难度匹配） 3.听说读写一体化 4.单词速记（时文+课本） 5.智能口语+AI作文批改 6.大数据分析+错题推送 7.社群打卡+在线答疑 - 利用DeepSeek的自然语言处理模型，对接培训平台的口语练习模块，开启智能口语评测功能。 - 在系统后台配置文本生成任务

2025-05-28

DeepSeek 智能工厂实战攻略

2025-05-28

DeepSeek 语音交互密匙

2025-05-28

DeepSeek 虚拟数字人打造指南

2025-05-28

DeepSeek 多模态部署全攻略

2025-05-28

tensorflow实现 YOLO v3目标检测算法（可fine-tuning）.zip

为了复现Yolov8模型并训练自己的数据集，首先需要准备一个适合深度学习的环境。以下是准备环境的步骤：安装Python：确保你的电脑上已经安装了Python，建议使用Python 3.6或更高版本。安装Anaconda：Anaconda是一个流行的Python发行版，包含了大量的科学计算和数据分析库。你可以从Anaconda官网下载并安装Anaconda。安装深度学习框架：选择一个适合你的深度学习框架，如TensorFlow或PyTorch。你可以根据框架的官方文档进行安装。安装YOLOv8依赖包：在Anaconda中创建一个新的虚拟环境，然后使用pip安装YOLOv8所需的依赖包。二、准备自己的数据集在训练YOLOv8之前，需要准备一个合适的数据集。以下是准备数据集的步骤：收集数据：根据你的目标任务，收集相应的数据。确保数据集具有足够的多样性，并且标记准确。数据预处理：对数据进行必要的预处理，如缩放、归一化、数据增强等。这些步骤可以帮助模型更好地学习数据的特征。创建voc_label.py文件：创建一个名为voc_label.py的文件，用于生成训练集、验证集和测试集的标签。在该文件中，你需要编写代码将数据集路径导入txt文件中，并生成对应的标签。数据集格式：确保你的数据集格式与YOLOv8的要求一致。一般来说，YOLOv8需要的数据格式包括图片、标注文件和类别文件等。你需要将这些文件整理到一个文件夹中，并按照一定的命名规则进行命名。

2025-05-28

一个数据集可直接用于yolov8的训练.zip

2025-05-28

DeepSeek 农业智能方案集

2025-05-28

DeepSeek 智慧物流优化手册

实操指南： - 在DeepSeek的“模型部署”模块中，选择训练好的模型。 - 设置部署环境，如CPU/GPU、内存大小等，点击“部署”。 - 获取API接口，集成到应用中。 4. 数据处理与增强 DeepSeek提供强大的数据处理工具，支持数据清洗、标注、增强等功能。用户通过这些工具，能快速准备高质量的训练数据，提升模型性能。 - 实操指南： - 在DeepSeek的“数据处理”模块中，上传原始数据。 - 使用DeepSeek的数据清洗工具，去除噪声数据。 - 利用数据增强功能，如图像旋转、文本替换等，生成更多训练样本。 5. 可视化与监控 DeepSeek提供丰富的可视化工具，帮助用户监控模型训练过程、分析模型性能。用户可通过图表和报告，直观了解模型的训练进度和效果。 - 实操指南： - 在模型训练过程中，打开DeepSeek的“可视化”面板。 - 查看训练损失、准确率等指标的实时变化。 - 使用DeepSeek的分析工具，生成模型性能报告。三、DeepSeek的进阶技巧 1. 多任务学习 DeepSeek支持多任务学习，用户可在一个模型中同时处理多个相关任务，提升模型的泛化能力。例如在NLP任务中，可同时进行文本分类和命名实体识别。 - 实操指南： - 在模型训练时，选择“多任务学习”模式。 - 为每个任务设置相应的损失函数和权重。 - 启动训练，观察模型在多任务上的表现。 2. 迁移学习 DeepSeek的预训练模型库为迁移学习提供强大支持。用户通过迁移学习，可将预训练模型应用于新的任务，显著减少训练时间和数据需求。 - 实操指南： - 选择一个与任务相关的预训练模型。 - 冻结模型的部分层，只训练最后的几层。 - 使用数据集进行微调，观察模型在新任务上的表现。

2025-05-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

DeepSeek 智能办公升级指南

DeepSeek 教育智能应用集

DeepSeek 图像处理宝典

DeepSeek 多模态应用快线

重写改进Java爬虫框架ScriptSpider-master

智能GPT图书管理系统,全局异常拦截器，登录校验拦截器，Echarts展示借阅量，可添加爬虫功能获取图书数据.zip

这是一个学习爬虫的仓库

一个自动管理ChromiumDriver版本的，基于Selenium开发的自动化测试爬虫框架

一个轻量级网络多线程爬虫框架

一个轻量级的基于事件分发的爬虫框架

一个简单的超快速异步爬虫框架.zip

它提供简单灵活的API，只需少量代码即可实现一个爬虫

它是一个先进的网络爬虫工具，利用 BeautifulSoup 和机器学习技术实现高效的数据提取和分析

使用爬虫+数据分析+图形化操作, 使得学生的做题情况显示到web网页上

实战多种网站、电商数据爬虫.zip

爬虫管理系统，支持集群，弹性伸缩 支持运行feapder、scrapy、selenium、platwright等各种框架及脚本

地铁大数据客流分析系统.zip

不懂数据采集技术，也可轻松采集海量数据.zip

城市房价分析系统-爬虫,使用scrapy框架实现.zip

一个Qt开发的可以替代爬虫的网页数据采集软件

DeepSeek 知识服务创新手册

DeepSeek 智能工厂实战攻略

DeepSeek 语音交互密匙

DeepSeek 虚拟数字人打造指南

DeepSeek 多模态部署全攻略

tensorflow实现 YOLO v3目标检测算法（可fine-tuning）.zip

一个数据集可直接用于yolov8的训练.zip

DeepSeek 农业智能方案集

DeepSeek 智慧物流优化手册

DeepSeek 智能写作创意库

DeepSeek 智能助手开发指南

用YOLOv8训练自己的数据集.zip

在YOLOv7的基础上使用KLD损失修改为旋转目标检测yolov7-obb.zip

基于yolov3-tiny-bubbliiiing和Tkinter开发检测界面.zip

yolov8目标检测后端api服务，为相关程序提供算法支持，用于图像中的衣物检测，数据集Deepfashion2.zip

DeepSeek 数据分析深度探索宝典

DeepSeek 智能文档处理秘籍

DeepSeek 智能交通解决方案

DeepSeek 智慧零售运营宝典

DeepSeek 安防监控智能体

空空如也

爬虫管理系统，支持集群，弹性伸缩支持运行feapder、scrapy、selenium、platwright等各种框架及脚本