- 博客(402)
- 资源 (2)
- 收藏
- 关注
原创 高质量数据集建设SOP与质量验收表
本文档制定了高质量数据集建设的标准作业流程(SOP)和质量验收表。SOP包含7个核心环节:前期准备、数据采集、清洗预处理、标注、融合增强、质量评估和存储管理,每个环节明确责任方、操作标准和输出物。质量验收表涵盖基础质量、标注质量、分布质量、合规安全等维度,设置具体验收指标(如准确率≥95%、完整率≥98%),要求抽检率≥10%并留存验收记录。整个流程强调合规性、质量控制和可追溯性,适用于各类数据类型和应用场景。
2026-03-06 22:14:53
448
原创 Markdown(MD)常用语法讲解
本文介绍了Markdown常用语法,帮助团队快速掌握文档编写技巧。主要内容包括:1)基础文本格式(标题、字体样式);2)有序/无序列表和任务列表;3)链接与图片插入方法;4)行内代码和代码块使用;5)表格制作;6)引用和脚注等实用功能。Markdown优势在于简单易用,仅需记住核心符号即可满足日常需求,建议团队统一格式规范以提高文档一致性。不同编辑器支持略有差异,推荐使用团队统一工具避免兼容问题。
2026-02-25 15:57:53
471
原创 项目全流程文档管理规范(团队版)
本文档规范了团队项目全流程的文档管理标准,涵盖立项、设计、开发、测试、上线和复盘各阶段。核心原则包括统一Git存储、版本控制、规范统一和落地可行。详细规定了各类文档的产出要求、存放目录和责任角色,并制定了严格的Git仓库管理规范,包括目录结构、命名规则、分支管理和提交规范。通过标准化文档管理流程,确保项目文档可追溯、可复用,减少协作内耗,提升交付效率。适用于产品、研发、测试等全体项目相关人员。
2026-02-25 15:05:38
972
原创 _cdecl_stdcall_fastcall 三种函数调用约定
三种调用约定的核心差异是参数传递方式和栈清理责任_cdecl调用者清理(支持可变参数),被调用者清理(性能/体积更优)。_fastcall是性能最优的,通过寄存器传递前两个参数减少栈操作,逆向时需注意寄存器(ECX/EDX)而非栈来获取前两个参数。栈帧的核心作用始终围绕:保存返回地址、维护参数/局部变量、恢复寄存器/ebp,调用约定仅改变「参数怎么传」和「栈谁来清」。
2026-02-13 16:41:14
618
原创 X86汇编PUSH与POP操作对于变量在内存中高低地址的转换分析
本文解析了x86架构下内存地址与栈操作的核心概念。内存被视作线性空间,低地址对应小数值,高地址对应大数值。栈从高地址向低地址扩展,压栈时栈顶指针esp减小,出栈时增大。通过main调用add函数的示例,展示了参数入栈、返回地址保存和栈帧建立的完整过程,说明栈帧中ebp指向高地址底部,esp指向低地址顶部。文章还指出实际地址受系统、编译器影响,但高低地址关系不变,并强调ebp在逆向分析中定位参数和变量的关键作用。总结三点:1)地址数值决定高低,栈向低地址生长;2)栈帧中ebp和esp分别指向高、低地址;3)函
2026-02-13 16:32:29
919
原创 Windows系统kernel32.dll核心函数编程
核心参数规则函数的核心参数(标★)是调用成功的关键,尤其是结构体的cb成员(如)必须初始化;权限类参数(如)需根据实际需求选择最小权限(如只读内存用),避免权限过高导致调用失败。资源释放规则所有句柄(进程、线程、文件、IOCP、查找句柄)必须手动释放(FindClose),否则造成资源泄漏;虚拟内存分配后需用释放,且dwSize必须为0,dwFreeType为。错误处理规则调用函数后必须检查返回值,通过获取错误码定位问题;跨进程操作(如)需管理员权限,否则返回错误码5(权限不足)。
2026-02-13 16:16:38
837
原创 Windows编程核心维度-DLL-具体函数对照表
函数命名规则带A后缀的函数(如)为ANSI编码,W后缀为Unicode编码,Windows系统优先使用W版本;核心定位类函数(如)无A/W后缀,直接兼容Unicode。调用关键注意事项跨进程操作(如)需获取足够权限(如),否则调用失败;钩子函数()需保证回调函数在有效内存中,DLL钩子需注入目标进程;资源类句柄(如文件映射、钩子、套接字)必须手动释放(如FindClose),避免泄漏。高频场景关联窗口监控用;全局热键/键盘监控用或;高性能网络IO用AcceptEx。
2026-02-13 16:07:29
565
原创 Win11 安装 Fiddler HTTPS 证书(用于抓包)
摘要: 本文介绍在Win11安装Fiddler HTTPS证书的两种方法:推荐使用Fiddler一键安装(勾选Decrypt HTTPS后信任证书),或手动导出证书并导入至"受信任的根证书颁发机构"。安装后可通过certmgr.msc验证证书存在。常见问题包括浏览器需重启、勾选忽略证书错误选项、管理员权限运行及重置证书冲突等解决方案。(150字)
2026-02-13 15:59:52
412
原创 Win11 使用 Proxifier 强制本地流量通过 Fiddler Classic 代理指南
在 Windows 11 环境中,通过可实现对本地(127.0.0.1)网络流量的强制代理,解决部分程序不遵循系统代理的问题。。
2026-02-13 15:57:30
612
原创 Fiddler Classic 全局代理与电脑程序抓包配置指南
Fiddler Classic 是 Windows 平台免费的 HTTP/HTTPS 抓包工具,通过在本机开启代理服务器捕获流量。以下是完整配置流程,包含全局代理设置与各类程序抓包方法。
2026-02-13 15:47:58
915
原创 Windows编程核心维度-DLL-具体函数对照速查表。
函数命名规则带A后缀的函数(如)为ANSI编码,W后缀为Unicode编码,Windows系统优先使用W版本;核心定位类函数(如)无A/W后缀,直接兼容Unicode。调用关键注意事项跨进程操作(如)需获取足够权限(如),否则调用失败;钩子函数()需保证回调函数在有效内存中,DLL钩子需注入目标进程;资源类句柄(如文件映射、钩子、套接字)必须手动释放(如FindClose),避免泄漏。高频场景关联窗口监控用;全局热键/键盘监控用或;高性能网络IO用AcceptEx。
2026-02-13 12:45:31
597
原创 YOLO模型集成到Label Studio的MODEL服务
摘要: 本文介绍如何将YOLO模型集成到Label Studio的MODEL服务中,实现自动标注功能。首先需要安装Label Studio、YOLOv8及相关依赖包(如FastAPI、Pillow)。Label Studio通过REST API发送图片标注请求,模型服务需返回符合其规范的JSON响应。文中提供了完整的Python代码实现,包括图片获取(支持URL/base64)、YOLO推理结果转换工具函数,以及FastAPI核心接口的编写方法,最终将检测框坐标、类别和置信度转换为Label Studio可
2026-02-07 18:37:01
805
原创 Lable studio 数据标注配置Source Cloud Storage与Target Cloud Storage
Label Studio中的来源云存储和目标云存储功能完全不同。来源云存储作为数据输入源,用于从云存储(如S3、OSS等)读取待标注数据并自动创建任务,支持定期同步新增文件。目标云存储则作为输出目的地,将标注结果自动同步到指定云存储,便于后续使用和数据备份。两者核心区别在于数据流向(外部→LS vs LS→外部)和用途(提供原始数据 vs 存储标注结果)。
2026-02-04 17:24:09
261
原创 5种落地性最强的对齐微调数据集格式
本文介绍了5种主流的大模型对齐微调数据集格式,涵盖SFT基础指令、DPO成对偏好、RLHF排序偏好、多轮对话和混合维度精细化标注场景。所有格式均采用JSONL结构,适配不同对齐算法(SFT/DPO/RLHF等),并标注了核心字段、示例和工程注意事项。格式1-3分别适用于基础微调、偏好优化和奖励模型训练;格式4支持多轮对话场景;格式5通过多维度评分实现精细化对齐。这些格式可直接用于实际训练,满足不同场景下的对齐需求。
2026-01-30 12:18:24
647
原创 大语言模型微调数据对齐五大核心算法SFT、RLHF、DPO、PPO、GRPO
SFT的基础地位不可撼动:所有对齐算法均以SFT模型为初始模型,高质量SFT数据集是对齐的核心前提,目前行业主流做法是结合开源通用指令集+行业专属指令集构建SFT数据;DPO成为行业主流:因流程简单、成本低、效果优,DPO已替代RLHF成为90%以上大模型研发团队的首选对齐算法,开源生态(如DPOv2、KD-DPO)也在持续优化,进一步提升其对齐效果和样本效率;RLHF(PPO/GRPO)聚焦极致场景。
2026-01-30 12:17:14
1124
原创 Nano Banana Gemini 2.5 Flash Image闭源API提供服务
摘要:Nano Banana(Gemini 2.5 Flash Image Preview)是谷歌开发的闭源AI模型,仅通过API提供图像生成与编辑服务。常见误解包括将其与开源工具混淆,或误认为存在开源版本。实际开源替代方案包括阿里的Qwen-Image(Apache 2.0协议)、FLUX.2(OpenCore)等独立模型。用户需注意区分API工具与模型本体的开源性质。(150字)
2026-01-26 23:56:44
161
原创 linux长命令未结束强制换行
Docker 长命令换行核心标识:Linux/macOS 用,Windows 用;加在参数末尾后面无任何字符,最后一行不加;换行后可缩进,仅提升可读性,不影响执行;贴合你的 Label Studio 场景的换行命令可直接复用,完美适配双-v 挂载的长命令。二、命令各部分详细解析mkdir -p ./logs:创建当前目录下的logs文件夹,-p是关键参数 ——若 logs 目录已存在,不会报错,避免重复执行命令时因目录存在导致中断;
2026-01-25 09:46:54
524
原创 迁移本地Label Studio容器到云端登录500错误排查与解决
摘要:本文分析了Label Studio容器迁移至云端后登录报500错误的原因及解决方案。核心问题在于容器内目录权限与宿主机不匹配,导致非root用户无法读写关键数据文件。排查步骤包括查看容器日志、检查权限配置,并提供了三种解决方案:临时放宽权限(测试用)、精准修改属主(生产推荐)以及应急root运行方案。同时补充了文件完整性、挂载路径及安全策略等可能原因的排查方法。
2026-01-25 09:39:27
490
原创 Docker run 挂载本地两个目录到容器内的写法(核心规则+实操示例)
多次使用-v参数,一个-v对应一组本地-容器路径映射;-v 本地路径:容器路径 -v 本地路径2:容器路径2,换行/单行均可;Label Studio适配:结合容器固定路径(数据库)和(标注数据)挂载,数据可持久化;避坑关键:本地路径用$(pwd)/相对路径或绝对路径,容器内路径不重复,提前创建本地目录并赋权。
2026-01-25 00:32:21
479
原创 Docker 容器内文件↔本地双向复制备份
无需进入容器,运行中即可操作),以下是全场景可执行命令,均结合你的Label Studio容器+数据库文件做实操示例,直接复制可用。✅ 复制成功后,进入容器即可在目标路径看到文件,Label Studio可直接识别容器内的导入文件。这是最常用的场景(如把容器内的数据库文件备份到本地、把本地的数据集导入容器),核心命令为。进入容器交互式终端后,文件复制和普通Linux系统完全一致,核心命令为。✅ 复制成功后,直接在本地对应路径查看即可,无任何额外操作。,无需额外学习,适配容器内所有文件操作。
2026-01-25 00:29:26
603
原创 Nginx 反向代理发布label-studio
以下是可直接使用的完整Nginx配置,核心实现的反向代理,同时处理路径重写、客户端真实IP透传等关键问题,配置后aaa.com(及子路径)会全部代理到服务。
2026-01-25 00:26:39
416
原创 Docker 从本地Label-studio导入 tar 镜像包
从本地 tar 包导入 Docker 镜像的,搭配-i参数指定本地 tar 包路径即可,操作极简且无需解压缩(直接识别 Docker 镜像归档格式),以下是,命令可直接复制执行。
2026-01-25 00:12:57
348
原创 YOLO模型训练、评估与推理
本文深入探讨了YOLO系列目标检测模型的性能优化方法及其应用效果。文章首先分析了YOLO模型在实时场景中的独特优势,包括速度快、架构简洁等特点。随后详细介绍了7大优化技术,包括版本选择、图像尺寸调整、半精度计算等,并通过实验数据展示了不同优化方法对性能指标的影响。在模型对比部分,文章基于头盔检测数据集,对YOLOv8n、YOLOv9t和YOLOv10n进行了全面评估,通过Precision、Recall、mAP等指标的系统分析,得出YOLOv8n在该任务上表现最优的结论。研究结果为实时目标检测系统的模型选择
2026-01-22 12:09:32
736
原创 YOLO目标检测保障真实抽烟场景的检测准确率错报警降低80%
基于 YOLO 的视觉检测算法,解决单帧检测中把 “笔放嘴边” 误判为 “抽烟” 并错误报警的问题,核心目标是通过算法升级降低这类场景的错报率。
2026-01-22 11:09:50
342
原创 大模型skills技能与函数调用与多模态协作协议MCP三者关联与区别
摘要: 在大模型智能体体系中,Skills、Function Call与MCP构成层级协作关系: 定位:Skills是业务能力单元(如"课程推荐"),Function Call是工具调用的标准化指令协议(如JSON指令),MCP是跨组件协作的底层规范(如多模态交互规则)。 关联:MCP涵盖Function Call的通用规则,Function Call支撑Skills的调用执行,形成"协议层→通信层→业务层"的闭环。 区别: Skills解决"做什么&quo
2026-01-22 10:58:43
834
原创 Apache Superset开源现代化数据BI工具
Apache Superset 是一款开源BI工具,支持数据可视化和交互式仪表盘。本文提供结构化部署与使用指南:1) 环境准备,推荐Docker一键部署;2) 数据源连接,支持主流数据库;3) 可视化流程,从创建数据集到制作图表和仪表盘。进阶技巧包括自定义指标、权限管控和性能优化。最后介绍3种集成方案,重点推荐官方嵌入式集成,通过配置嵌入权限和生成令牌,将Superset无缝整合到企业系统中,保留完整交互功能。
2026-01-21 00:11:04
1027
原创 论API网关的重要性
API网关是分布式系统的关键组件,具有四大核心价值:统一入口简化调用、集中封装共性功能、强化安全防护、支持高级流量管理。它作为唯一门面隐藏内部服务拓扑,集中处理认证、限流等非业务功能,隔离内外网降低安全风险,并支持灰度发布、负载均衡等流量控制策略。适用于微服务架构和对安全、可观测性要求高的场景,Java生态推荐使用Spring Cloud Gateway等实现。API网关并非多余中间层,而是提升系统可用性和开发效率的重要基础设施。
2026-01-19 09:54:28
605
原创 零代码微调,打造领域专属大模型
通用大模型在特定领域或任务上可能表现不佳。通过有监督微调(SFT),将特定知识和角色风格融入模型,提升其在特定任务(如角色扮演、目标检测)上的表现。本方案介绍使用阿里云百炼微调模型及多种最佳实践,无需编码,快速投入应用。适用客户。
2026-01-19 09:11:37
402
原创 大模型轻量化调优(昇腾平台方向)岗位技术名词拆解
摘要: 该岗位聚焦大模型轻量化调优在昇腾平台的落地应用,核心技术涉及四大方向: 大模型适配:需精通Qwen、LLaMA等主流开源模型的Transformer架构特性,重点解决MoE架构的稀疏化部署难题 轻量化技术:核心开展W4A8/W8A8混合量化、Transformer层剪枝、KV-Cache优化等工作,需开发敏感层分析等精度保障方案 昇腾平台专项:要求熟悉CANN软件栈与昇腾NPU硬件特性,实现量化模型的高效编译与性能调优 工程落地能力:需具备显存优化、自定义层开发等实战经验,确保轻量化模型在Atlas
2026-01-18 23:18:44
449
原创 大模型开发工程师招聘中经常提到的技术名词
摘要: 本文整理了大模型开发中的关键技术名词,分为预训练/参数高效微调技术和模型微调技巧两类。预训练技术包括MLM(掩码语言模型)、CLM(因果语言模型)等核心任务,以及LoRA(低秩适应)、P-tuning(提示微调)等高效微调方法。模型微调技巧涵盖EMA(指数移动平均)、FGM(快速梯度方法)等优化策略。通过对比表格详细说明了各项技术的核心目标、适用场景、优势和注意事项,为理解大模型开发中的关键技术提供了系统化参考。
2026-01-18 23:11:58
536
原创 采用EVENT定时任务同步视图到物理表提升视图查询效率
MySQL的EVENT定时任务通过预计算视图数据并存储到物理表,显著提升查询性能。核心步骤:1)创建与视图结构一致的物理表;2)启用MySQL事件调度器;3)设置定时任务(支持全量/增量刷新策略)。相比实时视图计算,该方法适用于高写入、低实时性要求的场景(如报表统计),通过牺牲少量数据实时性换取查询效率的大幅提升。需注意保持视图与物理表结构一致,并合理选择刷新周期。
2026-01-18 18:01:13
750
原创 从同步和异步方式来做性能分析
摘要: 本文对比分析了OCR调用中同步与异步回调方式的性能差异。同步调用方案逻辑简单但存在严重性能瓶颈,如线程阻塞导致吞吐量受限、端到端延迟增加、资源利用率低下等问题,仅适用于低并发场景。异步回调方案通过解耦处理流程,能显著提升吞吐量(理论可达20000 QPS)、优化资源利用率、隔离OCR处理风险,并支持后续扩展优化。核心建议是:同步方案仅适合OCR耗时极短的低并发场景,而异步回调更适合生产环境的高并发需求,尽管开发复杂度略高,但性能收益显著。文末还提供了客户端轮询优化和引入Redis等额外建议。
2026-01-10 11:57:05
588
原创 CentOS 系统下 ModelScope 模型下载的默认目录
在CentOS系统中,ModelScope模型的默认下载路径为~/.cache/modelscope/hub/(~代表用户主目录)。可通过find ~ -name "模型名"快速查找已下载模型。如需修改默认存储位置,可编辑~/.bashrc文件,添加export MODELSCOPE_CACHE=新路径并执行source ~/.bashrc使配置生效。隐藏目录.cache需用ls -a查看,或直接使用绝对路径访问。
2026-01-09 00:06:06
456
原创 YOLOv8+TensorRT+DeepStream部署实操
Jetson系列是NVIDIA专为边缘端设计的嵌入式设备,本手册适配,覆盖「环境适配→模型转换→DeepStream推理→性能调优」全流程,兼顾精度与低功耗。
2026-01-01 00:01:15
1049
联想手机,联想A730,T卡备份,XML文件转换,成TXT文本文件
2012-03-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅