- 博客(1231)
- 收藏
- 关注
原创 集成学习常用组合策略:让多个模型“合作”得更好
本文介绍了集成学习中四种常见的组合策略:回归任务的平均法和加权平均法,分类任务的投票法和加权投票法。平均法和投票法简单直接,对所有学习器一视同仁;加权方法则通过分配不同权重来体现学习器的重要性差异。文章提供了Python代码示例,展示了如何用scikit-learn实现这些策略,并比较了它们的性能表现。选择合适的组合策略需考虑模型性能差异、数据噪声等因素,在实践中应通过实验确定最优策略。
2025-05-26 23:27:53
397
原创 3D Gaussian Splatting 查看工具 splatviz
针对3DGaussian Splatting工具兼容性问题,本文推荐使用Splatviz作为替代方案。该Python项目可在本地快速查看ply文件,支持训练过程监控、参数调试和视频生成功能。安装时需适配CUDA 12.6环境,建议复用已有的Gaussian-Splatting conda环境并手动安装依赖模块。运行中可能出现的GL库错误可通过重装驱动或conda安装gcc-12解决。相比原生的SIBRViewer对显卡的高要求,Splatviz在P104-100等低算力显卡上表现更优,且避免了Web方案在老
2025-05-26 23:26:25
643
转载 VitePress 集成 Twikoo 评论
Twikoo 是一个简洁、安全、免费的静态网站评论系统。主要特点:免费搭建,部署简单,功能很完善,隐私护安全,通知发邮件,管理有内嵌,总之免费又方便关于后端部署,大家可以看官网,或者这篇 VitePress 资源汇总 - 使用 Twikoo 评论系统。推荐使用 (免费,需配置域名加速访问) 或者 (免费)。这篇主要讲 Vitepress 前端如何集成。 2. 初始化 twikoo 组件
2025-05-26 23:24:16
2
原创 基于CARLA/ROS的多传感器融合感知系统实战教程(附完整代码)
本文介绍了一个基于CARLA仿真平台和ROS系统的多传感器融合自动驾驶感知系统。通过整合摄像头与激光雷达数据,解决了单一传感器的局限性。系统实现了时空同步、联合标定、3D目标检测和环境语义理解等核心功能,包含数据采集、预处理、点云-图像标定、模型训练及融合算法开发等完整流程。文章详细说明了环境配置、传感器同步策略、空间变换实现以及两种融合方式(前融合与后融合),并提供了性能评估指标和优化方向。该系统在仿真环境中实现了高精度目标检测,处理延迟低于100ms,为自动驾驶感知系统开发提供了完整的参考方案。
2025-05-26 23:22:13
260
原创 用 Tarjan 算法求解有向图的强连通分量
摘要:Tarjan算法是解决有向图强连通分量(SCC)问题的高效算法,通过单次DFS遍历即可识别所有SCC。该算法利用发现时间、最低访问时间等概念,结合栈结构在线性时间内完成SCC检测。其核心创新在于巧妙地将节点访问顺序与回溯机制结合,准确识别图中的循环依赖结构。该算法不仅具有O(V+E)的优异时间复杂度,还衍生出图的缩点技术和2-SAT问题求解等重要应用,展现了处理复杂依赖关系的强大能力,成为图论算法中的经典范例。
2025-05-26 23:21:13
789
原创 DevEco重大更新快来体验吧
HarmonyOS API 17正式发布,DevEco新增多项重要特性。本次更新支持创建API 17应用,并首次提供折叠手机和2in1设备模拟器支持。重点改进包括:新增34个ACL权限管理功能(其中2个为新权限),实现自动签名申请;优化WebView调试功能,支持自动监听进程转发端口;系统能力增强,新增窗口尺寸指定、AREngine深度估计、2in1设备适配优化等功能;引入FileManagerServiceKit提供文件管理服务。这些改进显著提升了开发效率和系统灵活性。
2025-05-26 23:20:03
698
原创 鸿蒙next 定位开发全场景实践
本文深入解析鸿蒙next位置服务开发,介绍了GNSS与网络定位两种核心方式,并详细讲解了四种典型场景的实现方法:当前位置定位通过getCurrentLocation()获取瞬时坐标;实时定位通过on('locationChange')追踪运动轨迹;后台定位结合长时任务实现持续更新;历史定位利用getLastLocation()获取缓存数据。文章还提供了常见问题排查方案,如定位偏差处理、权限检查等,并给出性能优化建议,包括动态调整定位策略、及时释放资源等
2025-05-25 22:18:18
742
原创 ES查询优化随记: 多路向量查询 & KNN IO排查 & 高效Filter使用
文章分享了Elasticsearch 8.13版本在向量搜索实践中的经验。主要介绍了三种多Query向量查询方案:Script平均查询、向量Script循环查询和KNN查询,并对比了性能差异。针对KNN查询导致的IO过高问题,提出了优化图大小和预加载两种解决方案。同时分析了Filter的三种使用方式(prefilter、postfilter和must)对查询效率的影响,其中prefilter效率最高。这些经验对于使用ES构建RAG系统及处理向量搜索场景具有实用参考价值。
2025-05-25 22:10:47
735
原创 传统异步回调 vs C++20协程
《传统异步回调 vs C++20协程》对比分析:传统异步回调实现简单但易陷入"回调地狱",代码可读性差、错误处理困难;C++20协程提供线性编程风格,避免嵌套回调,简化错误处理,但调试复杂且学习曲线陡。性能测试表明协程在高并发和IO密集型任务中表现更优,上下文切换开销小。协程适合复杂异步场景如网络开发,而简单场景仍可使用回调。需根据项目需求和团队水平选择合适方案。
2025-05-25 22:09:30
282
原创 玩转 C++11 多线程:让你的程序飞起来的 std::thread 终极指南
本文介绍了C++11中std::thread的多线程编程技术。主要内容包括:1) std::thread的基本创建方式,对比传统多线程API的不足;2) 线程参数传递技巧,包括按值传递、引用传递和使用std::bind;3) 线程同步机制,如互斥锁(std::mutex)、RAII风格的锁管理(std::lock_guard)、灵活锁(std::unique_lock)和条件变量;4) 线程池的实现与优化,减少线程创建销毁开销;5) 性能优化与调试技巧,如减少线程切换、合理设置线程数量、避免虚假共享等。
2025-05-25 20:05:38
333
原创 基于Scikit-learn与Flask的医疗AI糖尿病预测系统开发实战
本文基于MIMIC-III医疗数据集,构建了符合医疗标准的糖尿病预测AI系统。系统采用Python技术栈,通过XGBoost模型实现高精度预测,并集成FHIR和DICOM医疗标准。项目涵盖数据治理、特征工程、模型训练、API服务开发全流程,重点解决了医疗数据的隐私合规、异常值处理等特殊问题。系统部署采用Flask+Gunicorn架构,支持临床决策界面,并通过SHAP值增强模型可解释性。测试显示系统AUC达0.85以上,已在医院试运行并显著提升诊断效率。项目为医疗AI落地提供了完整的技术范式,未来可扩展至多
2025-05-25 19:56:23
429
原创 QT入门概述
是一个跨平台的C++应用程序开发框架具有短平快的优秀特质: 投资少、周期短、见效快、效益高几乎支持所有的平台, 可用于桌面程序开发以及嵌入式开发有属于自己的事件处理机制可以搞效率的开发基于窗口的应用程序。Qt是标准 C++ 的扩展, C++的语法在Qt中都是支持的良好封装机制使得 Qt 的模块化程度非常高,可重用性较好,可以快速上手。Qt 提供了一种称为 signals/slots 的安全类型来替代 callback(回调函数),这使得各个元件 之间的协同工作变得十分简单。
2024-07-18 18:46:28
849
原创 数据库备份与恢复
数据迁移(data migration)是指选择、准备、提取和转换数据,并将数据从一个计算机存储系统永久地传输到另一个计算机存储系统的过程。此外,验证迁移数据的完整性和退役原来旧的数据存储,也被认为是整个数据迁移过程的一部分。数据库迁移的原因是多样的,包括服务器或存储设备更换、维护或升级,应用程序迁移,网站集成,灾难恢复和数据中心迁移。根据不同的需求可能要采取不同的迁移方案,但总体来讲,MySQL 数据迁移方案大致可以分为物理迁移和逻辑迁移两类。通常以尽可能自动化。
2024-07-18 18:45:40
1273
原创 python基础环境
刚开始接触并学习一门开发语言,带着的想法,其实也挺有好处的:我并不是所有的东西都知道,但是代码跑起来了。但是时间久了,还是带着这种想法,可能就会遇到一些棘手的问题。比如电脑上不知不觉已经安装了多个python版本,python3.8/3.10/3.11,甚至一些软件中也集成有python解释器;那么我编写的python代码,到底是使用哪个解释器在执行?我通过pip包管理工具安装的依赖包到底在那个地方?为什么已经安装了依赖包,代码提示还是缺少依赖呢?
2024-07-17 16:10:29
1025
原创 Python 调整PDF页面尺寸大小
加载原始PDF文档originalPdf.LoadFromFile("报告.pdf")# 创建新PDF文档#创建PdfUnitConvertor类的对象,用于转换不同的测量单位# 将自定义尺寸的单位由毫米转换为点数(磅)# 创建一个自定义宽度和高度的SizeF对象# 遍历原始PDF中的页面# 在新PDF文档中添加自定义尺寸(180*225mm)的页面# 创建PdfTextLayout实例# 将文本布局设置为单页,以确保内容能够正确适应页面大小。
2024-07-17 16:08:54
1305
原创 Fastapi集成SSE服务后端主动推送消息到前端
SSE(Server-Sent Events)是一种允许服务器向客户端浏览器推送信息的技术。它是 HTML5 的一部分,专门用于建立一个单向的从服务器到客户端的通信连接。SSE的使用场景非常广泛,包括实时消息推送、实时通知更新等。严格地说,HTTP 无法做到服务器主动推送信息。但是,有一种变通方法,就是服务器向客户端声明,接下来要发送的是流信息(streaming)。也就是说,发送的不是一次性的数据包,而是一个数据流,会连续不断地发送过来。
2024-07-17 16:07:38
378
原创 ORM基础
ORM是MVC框架中的重要的部分。它实现了数据模型与数据库的解耦,即数据模型的设计不需要依赖于特定的数据库,通过简单的配置就可以轻松更换数据库,这极大的减轻了开发人员的工作量。dj.sqlite3是django中的集成数据库,在settings中配置好的,适合测试环境用【适用于数据量小的时候】1.创建对象映射关系,即创建模型类,其实就是在app下的models.py中,以类和属性的形式定义表的字段。2.配置数据库连接,并且有了关系映射关系,这个时候就可以通过命令在数据库中生成具体表了。
2024-06-24 15:58:43
475
转载 超越datetime:Arrow,Python中的日期时间管理大师
Arrow是一个Python库,它提供了一种合理且对人类友好的方法来创建、操作、格式化和转换日期、时间和时间戳。它实现了对datetime类型的更新,填补了功能上的空白,提供了一个智能的模块API,支持许多常见的创建场景。简单来说,它可以帮助您使用更少的导入和更少的代码来处理日期和时间。Arrow以时间之箭命名,并且受到moment.js和requests的极大启发。
2024-06-24 15:56:46
133
原创 数据剑舞,图表如潮!Matplotlib傲视数据可视化江湖
在代码的世界中,隐藏着一座神秘而神奇的画图殿堂,它就是Matplotlib。这座殿堂矗立在数据的海洋中,每一行代码都是一笔神奇的咒语,让数据在图像之间舞动,展现出无限可能。Matplotlib的大门上镶嵌着闪烁的彩虹宝石,每当有开发者走近,便散发出五彩斑斓的光芒,仿佛在诉说着这里的神秘。而在宫殿深处,站立着一座巨大的绘图笔,它拥有操控数据之力,将每一次绘图都变成了一场奇妙的冒险。当你走进Matplotlib的殿堂,就像踏入了一个充满魔力的世界,数据的颜色与形状便开始跃然纸上,呈现出无限可能的未来。
2024-06-23 23:31:14
509
原创 【算法-二分查找】实现过程、C++代码示例以及实际应用
也称为折半查找,是一个在已排序数组中查找特定元素的搜索算法。它的工作原理是将有序数组分成两半,然后检查目标值是在左半部分还是右半部分,然后在所选择的那部分中继续查找。这一过程将不断地重复,直到找到目标值或确定目标值不在数组中。
2024-06-23 23:28:30
284
转载 Java中static关键字
在《java编程思想》里有这么一段话:"static就是没有this的方法,在static方法内部不能调用非静态方法,反过来可以。而且可以在不创建类对象的情况下,仅通过类本身来调用static方法。这实际上就是static方法的主要用途。这句话说明了static方法的基本用途,即:在没有创建对象的情况下完成方法的调用显然staitc关键字修饰的方法或变量不需要依赖对象去访问,只要类被加载,就可以通过类名进行访问。static可以修饰成员变量和成员方法,通过编写static代码块也可优化程序性能。
2024-06-23 23:26:08
71
原创 python中包管理工具pip以及虚拟环境venv的使用
venv是python自带的环境管理工具(好像是3.7版本后才引入的),它的作用是创建虚拟环境,以便更好地管理每个项目中的包。最直观的好处就是用pyinstaller打包时不会引入很多不相关的包导致生成的可执行文件体积过大了。而且创建虚拟环境后vscode也能自动识别到,这就很方便了。绝大多数用户使用pycharm时使用的虚拟环境就是它。然后管理员权限运行power shell,输入命令。允许本地(本机)脚本无需数字签名运行。当前现用执行策略是否是。
2024-06-22 22:33:30
437
原创 按规则解析并替换字符串中的变量及函数
1、按照一定规则解析字符串中的函数、变量表达式,并替换这些表达式。这些函数表达式可能包含其它函数表达式,即支持函数嵌套__${
2024-06-22 22:31:55
284
原创 python接口自动化 之excel读取测试数据
range(起始值,终点值) range(2,5)------ [2,3,4]# 找到测试数据所在的表单 注:代码里面的表单名称要与Excel里面的表单名称一致。# 将datas转换成字典。excel中有用例名称、url、请求方式和请求参数。# 获取每一行的请求数据、地址、请求方法。# 单独获取某个单元格的值,第二行第二列。# 加载测试文件 此处存放的是本地路径。# for循环实现遍历---遍历行号。# 发送一次接口请求。# 拿到第一行的行号。
2024-06-19 21:30:27
556
原创 Python异步编程高并发执行爬虫采集,用回调函数解析响应
本例中,异步耗时的总时长与访问google.com超时时长相同,那么意味着,如果协程中如果有1个是耗时很长的任务,那么主线程还将被阻塞,异步解决不了这个问题,这时耗时协程应该拿出来,用子线程、或者子进程来执行。通常的编程,如果有4个任务,采用同步编程模式,4个任务是按顺序执行的,分别用时:10s,7s,5s,6s,共耗时28s;现在,采用Asyncio异步编程,以并发的运行方式,向多个网站同时发送request, 总耗时,应该是用时最长那个协程的用时。,相比同步编程方式,耗时减少了1半。
2024-06-19 21:29:07
2095
原创 Python 中如何向列表或数组添加元素
编程中的数组是一个有序的项目集合,所有的项目都需要是相同的数据类型。然而,与其它编程语言不同,数组在 Python 中不是一个内置的数据结构。Python 使用列表取代传统的数组。列表本质上是动态数组,是 Python 中最常见的和最强大的数据结构之一。你可以把它们想象成有序的容器。它们将同类相关的数据存储和组织在一起。存储在一个列表中的元素可以是任何数据类型。可以有整数列表、浮点数列表、字符串列表,以及任何其它内置 Python 数据类型的列表。
2024-06-18 06:47:01
3010
原创 高效Python-提高数据处理效率的迫切需要
本书的主题是如何从Python中获得高性能,只有从数据和算法需求以及计算架构等更广阔的角度来考虑,才能设计出高效的代码。帮助你理解CPU设计、GPU、存储替代方案、网络协议和云架构以及其他系统考虑因素(图1.4)的影响,从而为提高Python代码的性能做出正确的决策。无论是单台计算机、支持GPU的计算机、集群还是云环境,本书都将帮助您评估计算架构的优缺点,并实施必要的更改以充分利用其优势。
2024-06-18 06:44:27
1130
原创 掌握Python面向对象编程的关键:深度探索类与对象
在Python中,类是一种定义新数据类型的方式,它在一个逻辑框架内封装了数据(属性)和操作数据的函数(方法)。这个概念帮助我们建立更为复杂的数据模型,模拟现实世界中的各种对象和它们的交互方式。数据封装:类中的属性保存了对象的状态。这些属性通常在__init__方法中初始化,并可以通过对象的生命周期进行访问和修改。封装保证了数据的完整性和一致性。行为抽象:类中定义的方法描述了对象可以执行的操作。这些方法可以访问和修改对象的状态,或者与其他对象进行交互。继承。
2024-06-16 12:36:26
687
原创 Python控制流程盘点及高级用法、神秘技巧大揭秘!
这个列表解析的过程可以理解为:对于每个在 `range(10)` 中的 `x`,计算 `x` 的平方,然后将结果添加到列表中。生成器对象是一个可迭代的对象,它在每次迭代时都会生成新的值,而不是一次性生成所有的值。许多人可能不知道,`for`循环和`while`循环可以有一个可选的`else`子句,它在循环正常结束时执行。这个特性在很多情况下都非常有用,比如我们在循环中搜索一个元素,如果找到了就通过`break`语句终止循环,如果循环正常结束还没有找到,就执行`else`子句中的代码。
2024-06-16 12:35:40
828
原创 Python Django Web开发实战
Django是一个非常强大的Python Web开发框架,它以"快速开发"和"干净、实用的设计"为设计宗旨。本文将从Django的基本概念开始,逐渐引导大家理解如何使用Django构建复杂的web应用程序。
2024-06-16 12:35:01
727
原创 【pandas小技巧】--随机挑选子集
在pandas中,如果遇到数据量特别大的情况,随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据,从而更好地进行数据分析和决策。本篇介绍一种pandas挑选子集的方式,以及子集在机器学习中常用的一个场景。
2024-06-15 20:43:55
1039
原创 Python中对open读取文件内容时的mode模式解析
当读写文件采用'b'的模式时,要求必须以二进制形式读写,在python2中,字符串必须为str字符串,python3中必须为byte字符串;只读模式,open函数中mode参数的默认模式,文件不存在的话,报FileNotFoundError(python2是IOError);这里我们主要关心一下'r', 'w', 'a', 'r+', 'w+', 'a+', 'x',很多人容易混淆不同模式的读写操作。创建文件并写操作,操作必须是不存在的文件,如果操作的文件已存在,则报错FileExistsError。
2024-06-15 20:41:09
983
原创 多次复制Excel符合要求的数据行:Python批量实现
如下图所示,可以看到结果文件中,符合我们要求的行,已经复制了。知道了需求,我们就可以开始代码的书写。函数,读取我们需要加以处理的文件,并随后将其中的数据存储在名为。中(这样相当于对于我们需要的行,其自身再加上我们刚刚复制的那。其中,如下图所示,这一文件中有一列(也就是。在指定的范围内,那么就将这一行复制一下(相当于新生成一个。首先,我们来明确一下本文的具体需求。首先,我们需要导入所需的库;此时,我们即可基于我们的实际需求,对变量。函数,将处理之后的结果数据保存为一个新的。接下来,我们再创建一个空的。
2024-06-14 08:49:23
351
原创 selenium之3大等待方式
1、通过设定的时长等待页面元素加载完成,再执行下面的代码,如果超过设定时间还未加载完成,则继续执行下面的代码(注意:在设定时间内加载完成则立即执行下面的代码);本例中,设置的等待时长为10秒,但这10秒并非一个固定时间,并不影响脚本执行速度;其次,隐式等待对整个driver的周期都起作用,因此只需要设置一次即可。即sleep()方法,由python中的time模块提供,强制让代码等待xxx时间,无论前面的代码是否执行完成或者还未完成,都必须等待设定的时间。4、until方法入参中常用的method。
2024-06-14 08:48:26
308
转载 搭建个人图书馆!一个简单的在线个人书库
talebook—— 一个基于Calibre的简单的个人图书管理系统,支持在线阅读。友情提醒:个人是不允许进行在线出版的,维护公开的书籍网站是违法违规的行为!建议仅作为个人使用!
2024-06-14 08:47:12
495
重写改进Java爬虫框架ScriptSpider-master
2024-09-07
智能GPT图书管理系统,全局异常拦截器,登录校验拦截器,Echarts展示借阅量,可添加爬虫功能获取图书数据.zip
2024-09-07
这是一个学习爬虫的仓库
2024-09-07
一个自动管理ChromiumDriver版本的,基于Selenium开发的自动化测试爬虫框架
2024-09-07
一个轻量级网络多线程爬虫框架
2024-09-07
一个轻量级的基于事件分发的爬虫框架
2024-09-07
一个简单的超快速异步爬虫框架.zip
2024-09-07
一个Qt开发的可以替代爬虫的网页数据采集软件
2024-09-07
它提供简单灵活的API,只需少量代码即可实现一个爬虫
2024-09-07
它是一个先进的网络爬虫工具,利用 BeautifulSoup 和机器学习技术实现高效的数据提取和分析
2024-09-07
使用爬虫+数据分析+图形化操作, 使得学生的做题情况显示到web网页上
2024-09-07
实战多种网站、电商数据爬虫.zip
2024-09-07
爬虫管理系统,支持集群,弹性伸缩 支持运行feapder、scrapy、selenium、platwright等各种框架及脚本
2024-09-07
地铁大数据客流分析系统.zip
2024-09-07
城市房价分析系统-爬虫,使用scrapy框架实现.zip
2024-09-07
不懂数据采集技术,也可轻松采集海量数据.zip
2024-09-07
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版
2024-09-07
x-crawl 是一个灵活的 Node.js AI 辅助爬虫库.zip
2024-09-07
webmagicx一款基于webmagic的可配置化的爬虫框架
2024-09-07
feapder是一款支持分布式、批次采集、任务防丢、报警丰富的python爬虫框架.zip
2024-09-07
download-story 是多线程的网络小说的爬虫框架,项目里还实现一些使用该框架的爬虫
2024-09-07
这是一个小型的随机初始化模型,用于因果语言建模任务
2024-09-07
元数建模的Java功能部分,元数建模是一款丰富数据库
2024-09-07
信用风险模型建模工具包
2024-09-07
完整数据中台,web-kettle-vue 包含数据源,元数据
2024-09-07
无人机建模,控制及使用
2024-09-07
数学建模资料库.zip
2024-09-07
数学建模-癌症早诊标记物设计及其演化机理认知
2024-09-07
数学建模,模型训练.zip
2024-09-07
数据蓝图-数据库建模工具 V1.0 前端
2024-09-07
收集数学建模的各种案例
2024-09-07
软件建模-医院排队叫号系统后端
2024-09-07
全网最全数学建模模型与算法教程系列,带你走进数学建模的大门
2024-09-07
基于Django+MySQL腾讯漫画可视化分析与漫画评论数据建模
2024-09-07
基于 webgpu webg three.js 的开源CAD转3D编辑器
2024-09-07
后台监控建模和游戏手柄的输入.zip
2024-09-07
地球流体力学模拟系统.zip
2024-09-07
搬运认知建模库 DDM,以方便国内用户安装
2024-09-07
TipDM建模平台,开源的数据挖掘工具
2024-09-07
OpenGMS开放式建模平台前端
2024-09-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人