自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

人工智能(AI)技术,大模型技术,深度学习,机器学习,计算机视觉,AI工具实践应用等分享

任何疑问欢迎交流探讨,也可以直接与我联系,非常欢迎!

  • 博客(1333)
  • 资源 (13)
  • 收藏
  • 关注

原创 【Dify解惑】给一个 Dify Agent 加上网页爬取、搜索和计算能力,需要哪些集成步骤?

给一个 Dify Agent 加上网页爬取、搜索和计算能力,需要哪些集成步骤?

2025-12-17 00:24:09 425

原创 【Dify解惑】如何在 Dify 中为 Agent 设计“工具列表”,避免出现过度调用或乱调用?

如何在 Dify 中为 Agent 设计“工具列表”,避免出现过度调用或乱调用?

2025-12-17 00:23:28 219

原创 【Dify解惑】如何评估一个 Dify RAG 应用的效果:有哪几个关键指标和评测方法?

如何评估一个 Dify RAG 应用的效果:有哪几个关键指标和评测方法?

2025-12-15 20:16:40 723

原创 【Dify解惑】跨语言 RAG:如何在 Dify 中支持“英文文档 + 中文提问 + 多语言输出”?

跨语言 RAG:如何在 Dify 中支持“英文文档 + 中文提问 + 多语言输出”?

2025-12-15 20:15:53 506

原创 【Dify解惑】如何在 Dify 中实现“来源可追溯”:回答里自动附带引用文档和段落?

如何在 Dify 中实现“来源可追溯”:回答里自动附带引用文档和段落?

2025-12-15 20:15:18 513

原创 【Dify解惑】如何在 Dify 中实现“来源可追溯”:回答里自动附带引用文档和段落?

如何在 Dify 中实现“来源可追溯”:回答里自动附带引用文档和段落?

2025-12-15 20:14:35 707

原创 【Dify解惑】Dify 与 Milvus / pgvector 等向量库结合时,如何调优检索性能和成本?

Dify 与 Milvus / pgvector 等向量库结合时,如何调优检索性能和成本?

2025-12-15 20:14:01 873

原创 【Dify解惑】Dify 知识库更新频繁时,如何实现增量索引与热更新而不中断服务?

Dify 知识库更新频繁时,如何实现增量索引与热更新而不中断服务?

2025-12-15 20:08:55 1552

原创 【Dify解惑】面对法务、医疗等高风险场景,如何设计 Dify RAG 以降低幻觉风险?

面对法务、医疗等高风险场景,如何设计 Dify RAG 以降低幻觉风险?

2025-12-14 22:17:57 1012

原创 【Dify解惑】面对法务、医疗等高风险场景,如何设计 Dify RAG 以降低幻觉风险?

面对法务、医疗等高风险场景,如何设计 Dify RAG 以降低幻觉风险?

2025-12-14 22:14:44 458

原创 【Dify解惑】如何在 Dify 里同时做“知识库检索 + SQL 数据查询”的混合问答?

如何在 Dify 里同时做“知识库检索 + SQL 数据查询”的混合问答?

2025-12-14 22:13:37 607

原创 【Dify解惑】Dify 的 RAG Pipeline 和手写 LangChain/RAG 有哪些设计差异?

Dify 的 RAG Pipeline 和手写 LangChain/RAG 有哪些设计差异?

2025-12-14 22:12:39 651

原创 【Dify解惑】在 Dify 中做中文 RAG,文本切分、向量模型和召回策略应该如何选择?

在 Dify 中做中文 RAG,文本切分、向量模型和召回策略应该如何选择?

2025-12-14 22:11:49 569

原创 【Dify解惑】如何用 Dify 快速把一批 PDF 文档变成可检索的知识库?

如何用 Dify 快速把一批 PDF 文档变成可检索的知识库?

2025-12-14 21:58:18 622

原创 【Dify解惑】面对复杂流程,是用一个大工作流好,还是拆成多个子工作流更好?

面对复杂流程,是用一个大工作流好,还是拆成多个子工作流更好?

2025-12-13 17:43:13 890

原创 【Dify解惑】Dify 的变量、上下文和临时数据应该如何管理,避免混乱和泄露?

Dify 的变量、上下文和临时数据应该如何管理,避免混乱和泄露?

2025-12-13 17:42:21 1002

原创 【Dify解惑】如何在 Dify 中封装可复用的“工作流模块”,供多个应用共享?

如何在 Dify 中封装可复用的“工作流模块”,供多个应用共享?

2025-12-13 14:26:12 833

原创 【Dify解惑】如何为 Dify 工作流增加“重试、超时、补偿”机制来应对不稳定的外部服务?

如何为 Dify 工作流增加“重试、超时、补偿”机制来应对不稳定的外部服务?

2025-12-13 14:25:31 575

原创 【Dify解惑】如何在 Dify 中实现“先检索再总结”的两阶段工作流,而不是一次性调用大模型?

如何在 Dify 中实现“先检索再总结”的两阶段工作流,而不是一次性调用大模型?

2025-12-13 14:18:23 940

原创 【Dify解惑】一个典型的企业报表自动生成流程,在 Dify 中应该如何拆分节点?

一个典型的企业报表自动生成流程,在 Dify 中应该如何拆分节点?

2025-12-11 17:21:35 971

原创 【Dify解惑】如何在 Dify 工作流中实现“人机协同”:人工审核 + AI 自动处理?

如何在 Dify 工作流中实现“人机协同”:人工审核 + AI 自动处理?

2025-12-11 17:20:59 1082

原创 【Dify解惑】在 Dify 中设计一个“内容生产流水线”需要哪些关键节点?

在 Dify 中设计一个“内容生产流水线”需要哪些关键节点?

2025-12-11 17:20:13 978

原创 【Dify解惑】Dify 工作流中的条件分支和循环,可以支持多复杂的业务逻辑?

Dify 工作流中的条件分支和循环,可以支持多复杂的业务逻辑?

2025-12-11 17:08:04 661

原创 【Dify解惑】如何用 Dify 的 Chatflow 实现“多轮问答 + 表单收集”的一体化体验?

如何用 Dify 的 Chatflow 实现“多轮问答 + 表单收集”的一体化体验?

2025-12-11 17:07:20 1267

原创 【Dify解惑】如何为 Dify 接入企业统一身份认证(SSO / OAuth / LDAP)?

如何为 Dify 接入企业统一身份认证(SSO / OAuth / LDAP)?

2025-12-09 23:37:30 738

原创 【Dify解惑】. Dify 在云端(如 AWS / 阿里云)部署时,如何规划存储、网络与安全组?

. Dify 在云端(如 AWS / 阿里云)部署时,如何规划存储、网络与安全组?

2025-12-09 23:36:44 924

原创 【Dify解惑】多租户场景下,一套 Dify 实例如何为多个业务线提供服务而互不干扰?

多租户场景下,一套 Dify 实例如何为多个业务线提供服务而互不干扰?

2025-12-09 23:24:57 853

原创 【Dify解惑】在资源受限的服务器上运行 Dify 时,如何做性能和成本权衡?

在资源受限的服务器上运行 Dify 时,如何做性能和成本权衡?

2025-12-09 23:24:17 1123

原创 【Dify解惑】如何利用 CI/CD 管道实现 Dify 配置的版本管理与自动化发布?

如何利用 CI/CD 管道实现 Dify 配置的版本管理与自动化发布?

2025-12-09 23:23:06 1278

原创 【Dify解惑】如何为 Dify 配置多模型后端,实现按应用或按请求路由到不同模型?

如何为 Dify 配置多模型后端,实现按应用或按请求路由到不同模型?

2025-12-09 00:19:14 624

原创 【Dify解惑】 如何将 Dify 与 Ollama 结合,在本机跑起完全离线的智能助手?

如何将 Dify 与 Ollama 结合,在本机跑起完全离线的智能助手?

2025-12-09 00:18:38 991

原创 【Dify解惑】在 Kubernetes 上部署 Dify:一套可扩展的生产级架构应该怎么设计?

在 Kubernetes 上部署 Dify:一套可扩展的生产级架构应该怎么设计?

2025-12-09 00:17:45 645

原创 【Dify解惑】Dify 集成 vLLM 的最佳实践是什么,如何同时兼顾吞吐和延迟?

Dify 集成 vLLM 的最佳实践是什么,如何同时兼顾吞吐和延迟?

2025-12-09 00:16:57 974

原创 【Dify解惑】本地部署 Dify:Docker 与源码安装,哪种方式更适合我?

本地部署 Dify:Docker 与源码安装,哪种方式更适合我?

2025-12-09 00:16:15 989

原创 【Dify解惑】如何基于 Dify 复刻一个简化版的 ChatGPT 企业助手?

如何基于 Dify 复刻一个简化版的 ChatGPT 企业助手?

2025-12-07 15:39:06 711

原创 【Dify解惑】Dify 项目结构长什么样?一个 Dify 应用从前端到后端是如何组织的?

Dify 项目结构长什么样?一个 Dify 应用从前端到后端是如何组织的?

2025-12-07 15:38:31 1111

原创 【Dify解惑】Dify 的多环境管理(开发 / 测试 / 生产)应该如何规划?

. Dify 的多环境管理(开发 / 测试 / 生产)应该如何规划?

2025-12-07 15:37:52 909

原创 【Dify解惑】如何为团队中的非技术同事设计一套“傻瓜式”的 Dify 使用流程?

如何为团队中的非技术同事设计一套“傻瓜式”的 Dify 使用流程?

2025-12-07 15:36:45 727

原创 【Dify解惑】如果公司只允许内网访问,Dify 还能怎么部署和使用?

如果公司只允许内网访问,Dify 还能怎么部署和使用?

2025-12-07 15:35:52 760

原创 【Dify解惑】Dify 和 Flowise、LangChain、OpenAI Playground 相比各有什么优劣?

Dify 和 Flowise、LangChain、OpenAI Playground 相比各有什么优劣?

2025-12-06 18:35:04 680

爬虫案例基于arXiv API的热点趋势分析工具:利用Python爬虫与Z-score模型实现研究主题热度挖掘系统设计

内容概要:本文提供了一个可直接运行的Python脚本,用于从arXiv公开API抓取计算机科学、机器学习等领域近28天的论文数据,通过将时间划分为最近7天和此前21天两个窗口,利用词频统计、提升比(lift)和z-score显著性分析等方法,自动挖掘研究热点术语。脚本实现了文本预处理、n-gram提取、热点计算与榜单生成,并输出全局及分学科的热点排名CSV文件,整个过程遵循合规爬取原则,使用标准库和requests,具备良好扩展性。; 适合人群:具备一定Python编程基础,对科研趋势分析、数据抓取与文本分析感兴趣的研发人员、数据科学家或研究生;适合工作1-3年希望实践爬虫与数据分析结合的技术人员。; 使用场景及目标:①快速掌握当前学术前沿动态,自动识别新兴研究主题如“diffusion model”、“foundation model”等;②构建科研情报监控系统原型;③学习如何设计基于时间对比的热点发现算法及合规爬虫实现。; 阅读建议:此资源以实际代码驱动分析思维,建议结合脚本逐模块理解数据获取、文本处理与统计建模流程,可自行调整学科分类、时间窗口与阈值参数进行验证,并在此基础上扩展多源数据融合、可视化展示等功能。

2025-10-05

算法竞赛基于离线处理与树状数组的区间不同元素计数方法:蓝桥杯高频题型优化方案

内容概要:本文围绕蓝桥杯竞赛中常见的“离线+数据结构”类题目,详细讲解了“区间内不同数的个数”这一经典问题的高效解法。针对大规模输入下朴素方法易超时的问题,重点介绍了两种优化方案:解法A采用离线处理结合树状数组(Fenwick Tree),通过按右端点排序查询并动态维护元素最后出现位置,实现O((n+q)log n)的时间复杂度;解法B介绍莫队算法的基本思想及其适用场景。文章还提供了小样例的逐步执行过程、参考代码(Python/C++)、常见错误、边界坑点、自测数据及多种扩展变体,帮助深入理解和举一反三。; 适合人群:准备蓝桥杯等算法竞赛的学生,具备一定数据结构与算法基础、希望提升解题效率的初学者至中级选手(如提高组或省赛水平);; 使用场景及目标:①掌握离线查询与树状数组的实际应用技巧;②理解如何通过预处理和排序优化多查询问题;③避免常见TLE陷阱,提升编码稳定性与调试能力;④为应对类似“区间去重统计”及其变体问题提供模板和思路支持;; 阅读建议:建议结合提供的代码与测试用例动手实现,并通过手算模拟执行流程加深对“最后出现位置”机制的理解;注意输入输出优化和索引边界处理,在实际比赛中灵活选用解法A作为首选方案。

2025-10-05

【智能车竞赛】视觉组全栈技术方案:基于双处理器架构的路径识别与控制算法设计

内容概要:本文详细介绍了“中国大学生智能车竞赛(视觉/电磁通用组)”的完整参赛方案,涵盖赛题分析、系统架构设计、软硬件选型、核心算法实现(如视觉感知、状态机决策、轨迹规划与控制)、调参流程、测试评估体系及12周项目里程碑。重点采用双处理器分层架构(Raspberry Pi/Jetson Nano + STM32/ESP32),通过视觉处理获取道路特征,结合FSM实现多场景决策,并使用Pure Pursuit等算法完成横向控制,最终达成稳定跑完全程并精准停车的目标。同时提供常见问题解决方案与现场应对策略。; 适合人群:具备嵌入式开发与Python/C编程基础,参与智能车竞赛的本科生或研究生团队,尤其是有1-2年项目经验的技术负责人或核心开发者。; 使用场景及目标:①指导学生从零搭建智能车系统并实现稳定完赛;②掌握视觉感知、多传感器融合、实时控制、状态机设计等关键技术;③优化控制参数与系统鲁棒性以冲击高分。; 阅读建议:建议按照12周里程碑逐步推进,结合代码骨架搭建工程,重视标定与数据记录,在仿真与实车测试中反复迭代;重点关注延迟控制、抗干扰设计与现场快速调试能力。

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷1

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

【信息管理系统】基于Node.js与React的全栈项目管理系统:支持评审全流程的轻量级学术项目管理平台设计

内容概要:本文介绍了一个轻量级全栈项目管理与评审系统的Demo源码,覆盖从选题到归档的完整项目生命周期管理。系统支持学生提交、导师评审、管理员监管三大角色,功能包括项目CRUD、团队协作、里程碑跟踪、KPI设定、材料上传、评审评分、审计日志及数据导出。技术栈采用Node.js + Express作为后端,React + Vite构建前端,使用Tailwind CSS和shadcn/ui组件库,数据库为better-sqlite3,认证基于JWT与bcrypt加密,具备RBAC权限控制和基础安全防护。源码结构清晰,含详细目录、接口实现、数据库设计及运行指引,并提供种子数据用于快速启动。; 适合人群:具备一定全栈开发基础,熟悉JavaScript/Node.js/React的技术人员,尤其是高校开发者或参与科研项目管理的1-3年经验工程师。; 使用场景及目标:①学习全栈项目架构设计与前后端分离开发实践;②理解RESTful API设计、JWT认证、RBAC权限控制、审计日志等核心模块实现;③作为毕业设计、课程项目或科研管理系统的可扩展原型参考;④掌握从需求分析到部署运行的完整开发流程。; 阅读建议:建议结合文档依次搭建前后端环境并运行项目,通过内置账号体验各角色功能,随后深入源码理解路由逻辑、权限中间件、数据库操作与状态管理机制,可进一步扩展为生产级应用。

2025-10-05

【创新创业教育】基于评审导向的大学生创新创业训练项目高分策略设计:全流程规范化实施与成果可复现方法研究

内容概要:本文是一份针对大学生创新创业训练项目(如国家级大创项目)的“高分攻略”经验分享,系统梳理了从选题、团队搭建、项目执行到答辩全流程的关键策略。文章强调以评审标准为导向,围绕原创性、科学性、可行性、成果规范性四大维度进行逆向设计,提供具体可操作的模板与工具,如选题筛选标准、里程碑规划、证据链准备、答辩PPT结构等,帮助学生将创意转化为高分项目。核心理念是“用证据说话”,突出可验证、可量化、可落地的项目执行过程。; 适合人群:参与大学生创新创业训练计划(大创)、挑战杯、互联网+等科研创新类竞赛的本科生或研究生团队;尤其适合缺乏项目经验但希望提升项目质量和评审得分的学生。; 使用场景及目标:①指导团队科学选题并设计符合评审偏好的项目方案;②规范项目全过程管理,包括进度控制、数据记录、经费使用与成果固化;③高效准备高质量申报材料与答辩展示,提升获奖概率。; 阅读建议:建议团队在立项初期即参照本文框架开展规划,结合提供的模板(如PRD、风险清单、KPI设定等)边执行边积累过程证据,注重原始记录与合规性,避免后期补材料。同时应定期对照“中期自查清单”进行复盘调整,确保项目稳步推进。

2025-10-05

【深度学习-活体检测】CASIA-SURF-images-压缩卷4

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-images-压缩卷3

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-images-压缩卷2

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷4

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-images-压缩卷1

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击(如纸质打印的多种裁剪方式)。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷3

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷1

CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。数据量大,包括压缩卷1-压缩卷4. 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷2

CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。数据量大,包括压缩卷1-压缩卷4. 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-Challenge-压缩卷3

数据量大,包括压缩卷1-压缩卷3. **CASIA-SURF-Challenge** 是由中国科学院自动化研究所发布的大规模人脸活体检测数据集,专为学术竞赛与算法研究设计。该数据集包含超过 **1,000 名被试**,采集了 **RGB、Depth、Infrared** 三模态人脸图像,总量达到 **数百万帧**,并覆盖多种攻击类型(如打印照片、视频回放等),同时划分了严格的训练、验证和测试协议。 它的价值在于:作为目前规模最大的多模态活体检测数据集之一,它为研究者提供了 **高质量、多模态、多样化攻击场景** 的基准,使得算法能够在真实应用中更具鲁棒性和泛化性。通过挑战赛的形式,它还推动了业界和学术界在 **人脸反欺骗、活体检测** 方向上的算法比拼与进步,成为该领域的一个重要里程碑数据集。

2025-10-04

【深度学习-活体检测】CASIA-SURF-Challenge-压缩卷1

数据量大,包括压缩卷1-压缩卷3. **CASIA-SURF-Challenge** 是由中国科学院自动化研究所发布的大规模人脸活体检测数据集,专为学术竞赛与算法研究设计。该数据集包含超过 **1,000 名被试**,采集了 **RGB、Depth、Infrared** 三模态人脸图像,总量达到 **数百万帧**,并覆盖多种攻击类型(如打印照片、视频回放等),同时划分了严格的训练、验证和测试协议。 它的价值在于:作为目前规模最大的多模态活体检测数据集之一,它为研究者提供了 **高质量、多模态、多样化攻击场景** 的基准,使得算法能够在真实应用中更具鲁棒性和泛化性。通过挑战赛的形式,它还推动了业界和学术界在 **人脸反欺骗、活体检测** 方向上的算法比拼与进步,成为该领域的一个重要里程碑数据集。

2025-10-04

【深度学习-活体检测】CASIA-SURF-Challenge-压缩卷2

数据量大,包括压缩卷1-压缩卷3. **CASIA-SURF-Challenge** 是由中国科学院自动化研究所发布的大规模人脸活体检测数据集,专为学术竞赛与算法研究设计。该数据集包含超过 **1,000 名被试**,采集了 **RGB、Depth、Infrared** 三模态人脸图像,总量达到 **数百万帧**,并覆盖多种攻击类型(如打印照片、视频回放等),同时划分了严格的训练、验证和测试协议。 它的价值在于:作为目前规模最大的多模态活体检测数据集之一,它为研究者提供了 **高质量、多模态、多样化攻击场景** 的基准,使得算法能够在真实应用中更具鲁棒性和泛化性。通过挑战赛的形式,它还推动了业界和学术界在 **人脸反欺骗、活体检测** 方向上的算法比拼与进步,成为该领域的一个重要里程碑数据集。

2025-10-04

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷5

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷5 数据内容包含四种模态的对齐人脸图像:C(Color,可见光/彩色)、D(Depth,深度)、I(Infrared,红外)、T(Thermal,热成像)。它将原始的多模态采集数据统一裁剪、对齐和归一化,方便研究者直接在不同模态上开展算法训练和测试,而不需要再处理原始视频或多传感器输出。-由于内容太大,包括压缩卷1-压缩卷5 它的价值和作用主要在于: 多模态研究基准:为人脸活体检测/展示攻击检测(PAD)提供了丰富的传感器维度,能支持单模态、跨模态以及多模态融合研究。 复杂攻击覆盖:WMCA 数据集涵盖多种攻击类型(纸质照片、3D 面具、视频回放等),结合 CDIT 四通道,使研究者能在更贴近真实应用场景的数据上评估模型鲁棒性。 推动算法泛化:相比只用 RGB 的数据集,这一预处理版本能帮助探索不同模态的互补性,从而提升系统在真实环境中的泛化与安全性。 一句话总结:WMCA_preprocessed_CDIT.tar.gz 是一个包含 Color、Depth、Infrared、Thermal 四通道人脸图像的预处理数据集版本,价值在于为人脸反欺骗提供标准化、多模态的实验基准,支持更全面和更鲁棒的算法研究。

2025-10-04

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷4

数据内容包含四种模态的对齐人脸图像:C(Color,可见光/彩色)、D(Depth,深度)、I(Infrared,红外)、T(Thermal,热成像)。它将原始的多模态采集数据统一裁剪、对齐和归一化,方便研究者直接在不同模态上开展算法训练和测试,而不需要再处理原始视频或多传感器输出。-由于内容太大,包括压缩卷1-压缩卷5 它的价值和作用主要在于: 多模态研究基准:为人脸活体检测/展示攻击检测(PAD)提供了丰富的传感器维度,能支持单模态、跨模态以及多模态融合研究。 复杂攻击覆盖:WMCA 数据集涵盖多种攻击类型(纸质照片、3D 面具、视频回放等),结合 CDIT 四通道,使研究者能在更贴近真实应用场景的数据上评估模型鲁棒性。 推动算法泛化:相比只用 RGB 的数据集,这一预处理版本能帮助探索不同模态的互补性,从而提升系统在真实环境中的泛化与安全性。 一句话总结:WMCA_preprocessed_CDIT.tar.gz 是一个包含 Color、Depth、Infrared、Thermal 四通道人脸图像的预处理数据集版本,价值在于为人脸反欺骗提供标准化、多模态的实验基准,支持更全面和更鲁棒的算法研究。

2025-10-04

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷3

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷1 数据内容包含四种模态的对齐人脸图像:C(Color,可见光/彩色)、D(Depth,深度)、I(Infrared,红外)、T(Thermal,热成像)。它将原始的多模态采集数据统一裁剪、对齐和归一化,方便研究者直接在不同模态上开展算法训练和测试,而不需要再处理原始视频或多传感器输出。-由于内容太大,包括压缩卷1-压缩卷5 它的价值和作用主要在于: 多模态研究基准:为人脸活体检测/展示攻击检测(PAD)提供了丰富的传感器维度,能支持单模态、跨模态以及多模态融合研究。 复杂攻击覆盖:WMCA 数据集涵盖多种攻击类型(纸质照片、3D 面具、视频回放等),结合 CDIT 四通道,使研究者能在更贴近真实应用场景的数据上评估模型鲁棒性。 推动算法泛化:相比只用 RGB 的数据集,这一预处理版本能帮助探索不同模态的互补性,从而提升系统在真实环境中的泛化与安全性。 一句话总结:WMCA_preprocessed_CDIT.tar.gz 是一个包含 Color、Depth、Infrared、Thermal 四通道人脸图像的预处理数据集版本,价值在于为人脸反欺骗提供标准化、多模态的实验基准,支持更全面和更鲁棒的算法研究。

2025-10-04

C++单目 RGB 视频即可进行实时三维手部追踪算法源码

只用单目 RGB 视频即可进行**实时三维手部追踪**的方法。它把卷积神经网络与手部运动学模型结合,能在遮挡、视角变化下保持解剖合理、时间平滑的手部姿态估计;使用一种**几何一致**的合成到真实图像翻译网络,将合成手部图像“GAN 化”为与真实分布一致的图像,用以训练追踪网络,并在困难的 RGB-only 视频上优于当时 SOTA。 **其核心贡献在于:1)首个在**非约束场景**中仅凭普通摄像头实现**全局 3D 关节**实时跟踪的系统;2)提出融合对抗损失、循环一致性与**几何一致性损失**的翻译网络,显式保留手部姿态几何,从而让“GANerated”图像既逼真又能沿用精确标注;3)据称构建了**>26 万帧**标注的 RGB 数据集,提升了规模、保真度与标注精度,显著缓解了真实 3D 标注难以获取的瓶颈。这些特性让其在 VR/AR、人机交互等需要低成本、通用摄像头输入的应用中具有长期影响。

2025-10-06

【支持C++和python】人体关键点实时检测

本项目实现了人体关键点(Pose Estimation)推理,支持 COCO 与 MPI 两种关键点定义。提供 Python 与 C++ 两套示例,便于快速上手与集成到你的工程中。 主要特性 支持 COCO / MPI 两种骨架格式切换 一键下载模型权重脚本 getModels.sh Python 与 C++ 双语言示例,接口简单、易扩展 适用于单张图片、视频与摄像头输入(可自行扩展)

2025-10-06

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷15

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷14

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷13

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷12

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷11

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷10

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷9

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷8

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷7

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷6

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷5

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷4

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷3

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷2

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷1

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷4

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷3

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷2

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除