自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Meiling_up

博客范围:科研闭环指南/科研工具分享/参会记录/干货分享/读书笔记/碎片思考/论文研读/……欢迎交流探讨~

  • 博客(201)
  • 资源 (6)
  • 收藏
  • 关注

原创 论文介绍|《人工智能生成图像检测技术综述》

本篇博客介绍由本人撰写的《人工智能生成图像检测技术综述》(已在中国图象图形学报官网出版)

2025-07-07 01:52:53 1580

原创 文献汇总|AI生成图像模型溯源相关工作汇总(2019年至今)

本篇博客总结 2019 年至今 通用AIGI(AI-Generated Image)模型溯源相关研究工作。

2025-04-22 17:24:01 1235

原创 文献汇总|AI生成图像检测相关数据集汇总

本博客汇总当前AI生成图像检测领域用到的数据集及相关链接。

2025-02-26 18:53:36 3007 2

原创 文献汇总|AI生成图像检测相关工作汇总(2018年至今)

本篇博客总结 2018年至今 通用AIGI(AI-Generated Image)检测相关研究工作。

2024-11-28 11:13:49 8935 3

原创 学术资讯|「隐者联盟」公众号介绍

本文为大家介绍多媒体与AI安全研究同行值得关注的一个非营利性质公众号——「隐者联盟」。

2023-08-17 09:36:16 1028

原创 论文研读|基于扩散过程的图像篡改定位

基于扩散过程的图像篡改定位

2025-11-15 21:38:55 1260

原创 一点思考|AIGI检测与溯源近期研究进展

在数据集构建方面,呈现这样一种趋势:数据集规模更大(高达百万级甚至 千万级)、涵盖的生成模型种类更多(GAN、扩散模型和自回归模型等)、图像类型更加丰富(人脸、物体和场景图像)、图像性质更加多元(真实图像、AI编辑图像和AI生成图像)。鲁棒性包括理想状态下的图像后处理操作(JPEG压缩、高斯噪声、高斯模糊、尺寸变换和裁剪等)和真实场景下的图像后处理操作(社交网络传输、重数字化等)。针对真实图像或AI生成图像,为提高检测结果的可解释性,主要使用视觉语言模型,在给出检测结果的同时,一并给出解释文本。

2025-11-04 03:47:22 668

原创 碎片笔记|Stable Diffusion 原理解析:潜空间扩散与去噪机制

本文介绍了Stable Diffusion图像生成的原理。扩散模型包含前向扩散(加噪)和反向扩散(去噪)两个阶段,关键组件是噪声调度器(控制噪声强度)和潜空间操作(提高计算效率)。核心在于U-Net架构的噪声预测器,通过交叉注意力机制融合文本提示(CLIP编码)与潜空间特征,并使用classifier-free guidance调节文本影响程度。最终通过DDIM等采样策略逐步去噪,将潜空间表示经VAE解码器还原为像素图像。整个过程实现了从文本到高质量图像的语义控制生成。

2025-10-18 01:56:35 976

原创 论文研读|基于潜变量反演的生成图像验证研究

本文综述了近年来基于潜变量反演的生成图像溯源研究。

2025-10-03 03:57:12 408

原创 碎片笔记|生成模型原理解读:AutoEncoder、GAN 与扩散模型图像生成机制

本文介绍了三种主流的图像生成模型架构:AutoEncoder(自编码器)、GAN(生成对抗网络)和Diffusion Model(扩散模型)。AutoEncoder通过编码-解码结构实现图像重建,其变体VAE可直接生成图像。GAN利用生成器与判别器的对抗训练生成逼真图像。Diffusion Model通过逐步去噪生成图像,其衍生模型LDM(潜空间扩散模型)在潜在空间进行扩散,显著降低了计算成本。这些模型各具特点,为图像生成任务提供了多样化的解决方案。

2025-10-01 07:10:03 1174

原创 如何解决模型的过拟合问题?

关于解决模型过拟合问题的一些探索。

2025-09-16 21:28:34 222

原创 AI妙想|从零开始创作的第一首AI单曲

分享自己首支AI单曲《无人知晓的盛开》从创意到成品的创作故事,相关作品已在网易云音乐发布,欢迎收听~

2025-08-18 21:17:26 751

原创 论文研读|基于图像修复的AI生成图像检测(CVPR 2025)

这个方法一个突出的特点就是,对于每个待检测的target model,都要训练一个替代模型模拟生成图像的分布,然后才能完成检测,可以看作是逐个击破,因此,相较于那些用来同时检测多种模型生成图像的基于分类器的方法而言,这种verification更加具有针对性,或许这就是这个方法可以取得较好效果的原因。1)是由于自己当时没有想到将场景设定为verification,而是采用基于分类器的检测场景设置,对不同的生成模型共用一个判定阈值,这就导致了不同生成模型的分布差异带来的预测结果错乱,最终效果可想而知。

2025-08-01 00:22:06 1243

原创 碎片笔记|图像质量评估(Image Quality Assessment, IQA)方法汇总及代码实现

本文介绍了常用的图像质量评估方法,包括全参考(FR)和无参考(NR)两类。全参考方法通过比较测试图像与参考图像进行质量评估,主要包括PSNR(峰值信噪比)、SSIM(结构相似度)、MS-SSIM(多尺度SSIM)、LPIPS(学习感知图像块相似度)、DISTS(深度图像结构纹理相似度)、CLIPScore(基于CLIP的语义相似度)以及FID/KID(分布距离度量)。无参考方法直接评估测试图像质量,包括NIQE、BRISQUE和Inception Score(IS)。

2025-07-21 23:54:31 2107

原创 参会记录|IJCNN 2025(Rome,Italy)

此篇博客分享博主在罗马参加 IJCNN 2025 学术会议的收获与体验

2025-07-07 04:17:59 1326

原创 科研闭环指南|学术会议海报制作要点

此篇博客分享用于学术会议的海报的制作经验,并给出海报模板以供借鉴。

2025-06-09 01:19:37 2230

原创 碎片笔记|PromptStealer复现要点(附Docker简单实用教程)

本文记录了复现PromptStealer论文的环境配置过程。为避免网络问题,使用huggingface镜像预先下载了论文中使用的lexica_dataset数据集。

2025-05-18 21:14:14 709

原创 碎片笔记|AI生成图像溯源方法源码复现经验(持续更新中……)

本篇博客分享了多种图像溯源方法的复现经验,涵盖Close-set Attribution、Open-set Attribution和Single-Model Attribution三大类。具体方法包括RepMix、De-Fake、DNA-Net、POSE、OCC-CLIP和LatentTracer。文章详细介绍了每种方法的环境配置、代码适配以及数据集处理中的常见问题和解决方案。

2025-05-14 23:26:47 1564 7

原创 大模型微调|使用 LLaMA-Factory 微调 Llama3-8B-Chinese-Chat 完成知识问答任务

本篇博客记录如何使用 LLaMA-Factory 微调 Llama3-8B-Chinese-Chat 完成知识问答任务,并介绍相应报错的解决方法。

2025-03-12 23:16:54 2136

原创 碎片笔记|国家自然科学基金介绍及申报书撰写心得

本篇博客分享国家自然科学基金申报书撰写心得。

2025-03-04 11:39:58 1726

原创 会议记录|2025 MAS Lab 年度组会记录

本篇博客记录 20250220 MAS Lab 第一次大组会要点。

2025-02-26 17:37:02 346

原创 大模型微调|使用LoRA微调Qwen2.5-7B-Instruct完成文本分类任务

本篇博客记录如何使用LoRA完成Qwen2.5-7B-Instruct微调及报错相应解决方法。

2025-01-15 11:41:12 6876 16

原创 问题清除指南|关于num_classes与 BCELoss、BCEWithLogitsLoss 和 CrossEntropyLoss 的关系

本篇博客介绍 num_classes 的值与 不同损失函数 的关系。

2025-01-03 15:28:39 1065

原创 文献汇总|Facial Deepfake检测相关工作汇总

本篇博客总结历年 AIGFI(AI-Generated Face Image)检测相关研究工作。

2024-12-28 11:50:37 1419

原创 讲座分享|阿里巴巴副总裁叶杰平教授《AI大模型开启智能化新时代》

本篇博客记录阿里巴巴副总裁叶杰平教授《AI大模型开启智能化新时代》讲座笔记。

2024-12-20 12:33:12 1163

原创 文献研读|基于像素&语义层面图像重建的AI生成图像检测

本篇文章主要对基于重建的AI生成图像检测的四篇相关工作进行介绍,分别为基于像素层面重建的检测方法 DIRE 和 Aeroblade,以及基于语义层面重建的检测方法 SimGIR 和 Zerofake;并对相应方法进行比较。

2024-12-18 22:55:22 1673

原创 问题清除指南|libpng库相关警告信息及其解决方案汇总

本篇博客对libpng库进行介绍,并记录使用libpng库时遇到的一些警告信息及相应的解决方案。

2024-12-16 21:38:51 2781

原创 问题清除指南|AEROBLADE论文复现相关要点总结

本篇博客总结本人在复现 CVPR 2024 论文 AEROBLADE 过程中遇到的一些问题及解决方案。注:仅仅使用了论文github源码中的Quickstart部分。

2024-12-10 22:00:19 1142 3

原创 科研闭环指南|MAS Lab “老带新”指导细则(研0必看)

本篇博客分享一些科研工具以及投稿关键信息获取的方式。

2024-10-29 11:26:16 1144

原创 参会记录|2024 中国计算机大会(CNCC 2024)

2024年10月24-26日,有幸在横店参加了2024年度的中国计算机大会(CNCC),本篇博客总结本人在会议期间收听的主要报告内容及收获。

2024-10-28 19:52:25 2316

原创 问题清除指南|alimama-creative/FLUX-Controlnet-Inpainting 运行注意事项

近日验证想法需要用到inpainting技术,选择了。

2024-10-18 10:38:32 1781 2

原创 会议记录|MAS Lab 年度组会记录

本篇博客记录 20240831 MAS Lab 第一次大组会要点。

2024-09-01 21:52:26 1279

原创 碎片笔记|Computer Journal 期刊投稿注意事项

Computer Journal 期刊投稿经验分享

2024-08-27 18:07:17 4186 16

原创 读书笔记|《我看见的世界》李飞飞

读书笔记|《我看见的世界》李飞飞

2024-08-27 14:58:36 1569

原创 参会记录|2024 中国多媒体大会

参会记录|2024 中国多媒体大会

2024-08-10 18:46:21 1274 1

原创 问题清除指南|成功解决pip&matplotlib因为ConnectTimeoutError更新失败问题

成功解决由于 ConnectTimeoutError 导致的 python 库更新失败问题

2024-07-18 07:03:02 439

原创 问题清除指南|Dell OptiPlex 7070 升级 win11 开启 TPM 2.0 教程

问题清除指南|Dell OptiPlex 7070 升级 win11 开启 TPM 2.0 教程

2024-07-11 18:01:48 2648 1

原创 论文研读|AI生成图像检测发展历程及研究现状

本篇博客系统性梳理AI生成图像检测的研究工作。

2024-07-07 22:49:53 4674 3

原创 针对AIGC检测的鲁棒性测试——常见攻击手段汇总

针对AIGC检测的鲁棒性测试——常见攻击手段汇总

2024-06-24 22:25:41 1703 2

原创 论文研读|以真实图像为参考依据的AIGC检测

这篇文章介绍几篇AIGC检测相关的工作。

2024-06-13 20:58:36 2838 2

第七届意大利中国博士学者论坛报告《人工智能生成图像检测与溯源》

第七届意大利中国博士学者论坛报告《人工智能生成图像检测与溯源》

2025-06-16

科研闭环指南|学术会议海报制作要点

科研闭环指南|学术会议海报制作要点

2025-06-09

AI大模型通用能力与安全测评的现状和发展趋势

内容概要:本文详细介绍了大型预训练模型(即大模型)的发展历程及其在全球范围内的影响,尤其是自从ChatGPT推出后所带来的巨大变革。文中不仅展示了国内外代表性大模型的具体进展及其综合能力评测框架,对多个评测维度的数据集(包括但不限于MMLU、C-Eval等)进行了详细的解读;而且着重讨论了安全评估的重要性,并列举了几种关键的安全基准(如SuperCLUE、SafetyBench等),说明了不同类型任务下模型表现的特点和局限性。 适合人群:科研工作者、高校师生、行业从业者以及其他对AI模型有兴趣的人群。 使用场景及目标:有助于深入了解当前最先进的自然语言处理技术和理论前沿;为未来研发更先进的机器学习工具提供了重要的借鉴意义。 其他说明:文中提到的大模型安全能力测评涵盖了广泛的主题,从社会伦理到具体的法律边界,确保AI系统能在尊重人权和社会秩序的前提下提供更好的服务。同时强调了自动化评价系统的高效性和人性化设计,保障了评测工作的透明公开性和可重复利用的价值。

2025-02-21

CSC联培博士生-导师推荐信模板

CSC联培博士生-导师推荐信模板

2024-08-27

AIGC检测研究脉络及发展现状介绍

本文介绍AIGC检测从2018年到2024年的经典研究工作,涵盖基于频域、像素域等多种检测切入点和数据增强、半监督学习、无监督学习、预训练模型等多种训练技术,有利于该研究领域的入门者进行全面了解。

2024-07-06

提示工程 & 自主生成提示 - 调研报告

本报告介绍大模型时代自主生成提示的相关工作。大模型对 prompt 十分敏感,提示词换一个字可能结果就大相径庭了。虽然人类设计 prompt 时有一些好用的 trick,但人类设计的 prompt 终归是有限的,并且这样的 prompt 是否足够泛化/鲁棒也是个问题,因此有人就在想,有没有办法让大模型自己生成 prompt,并且能够评价哪个 prompt 更好? 本篇报告介绍了几篇该领域的相关工作。

2024-05-18

图文交互模型的安全性问题探讨(含后门攻击)

图文交互模型的安全性问题探讨(含后门攻击)

2024-05-07

python3 版本实现的经典多臂老虎机算法(UCB,epsilon-greedy,exp3,hedge等)

python3 版本实现的经典多臂老虎机算法

2024-04-27

文献研读|AIGC溯源场景及研究进展

文献研读|AIGC溯源场景及研究进展

2024-04-03

Prompt窃取与保护相关文献介绍

Prompt窃取与保护相关文献介绍

2023-12-27

文献综述|NLP领域后门攻击、检测与防御

文献综述|NLP领域后门攻击、检测与防御

2023-08-14

「文献综述」生成式文本隐写

「文献综述」生成式文本隐写

2023-08-03

「分布式训练」+ DDP单机多卡并行指南

本课件包含对分布式训练及Pytorch两种主要的并行训练方式DP以及DDP的原理介绍, 以及使用 DDP 实现单机多卡并行方式的代码修改要点总结。

2023-07-20

自然语言生成主客观评价指标原理详解(附代码实现)

自然语言生成主客观评价指标原理详解(附代码实现) 客观评价指标: BLEU、METEOR、ROUGE、NIST、Distinct、Repetition Embedding Average Score、Greedy Matching Score 、Vector Extrema Score BertScore、BARTScore、MoverScore、BLEURT、Perplexity TER、CIDEr、SPICE 主观评价指标: 评估场景设置:评估人员、评估维度、评估机制 一致性校验方法:Percentage Agreement、Cohen’s Kappa(Cohen’s κ)、Fleiss‘ Kappa(Fleiss’ κ ) 以及 Krippendorff’s Alpha(Krippendorff’s α)及其代码实现 课件中包括评价指标的论文出处以及论文示例。

2023-07-20

Transformer Pytorch代码解读.pptx

本课件是对 CV&NLP 领域经典模型 Transformer 的 Pytorch 代码解读。

2023-07-20

Macbook快捷键命令大全.docx

最近上手 Mac,有一些快捷键和 Windows 系统有些出入,在此整理并分享给大家。

2023-06-15

Bert详解.pptx

本课件是对论文 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 的导读与NLP领域经典预训练模型 Bert 的详解,通过介绍NLP领域对通用语言模型的需求,引入 Bert 模型,并对其架构进行宏观微观的解读,然后详细介绍 Bert 每预训练阶段采用的两个任务,以及常见的微调下游任务场景。最后通过可视化的方式,给出 Bert 在向量表征上的优势所在。

2023-06-15

Transformer详解.pptx

本课件是对论文 Attention is all you need 的导读与NLP领域经典模型 Transformer 的详解,通过介绍传统Seq2Seq 模型及 Attention ,引入 Transformer 模型,并对其架构进行宏观微观的解读,然后详细介绍Transformer每一步的工作流程,最后给出 Transformer 在训练阶段的细节提要,以及推理阶段的解码策略等内容。

2023-06-15

CNN实现MNIST数据集分类

资源实现了多种适合MNIST数据集的CNN网络,包含自己设计的DenseCNN,著名的LeNet5、AlexNet、ZFNet和VGGNet16。实验结果的可视化包含损失和准确度随迭代次数的变化。模型可下载后直接运行。

2020-10-28

WinHex.rar

16进制文件编辑与磁盘编辑软件,同时也是一款隐写工具,可用来查看数字图像等文件的16进制编码。以此来嵌入或发现隐写内容。

2020-10-28

Automated Latent Fingerprint Recognition

论文Automated Latent Fingerprint Recognition相关的资料。包括论文及其演示视频、开源代码、论文框架梳理和文献阅读报告等内容。

2020-10-28

Finishing Flows Quickly with Preemptive Scheduling

Finishing Flows Quickly with Preemptive Scheduling论文、会议视频及演示文稿

2020-10-28

Vec2Face Unveil Human Faces from their Blackbox Features inFace Recognition

包括Vec2Face Unveil Human Faces from their Blackbox Features inFace Recognition论文和文献阅读报告

2020-10-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除