医学深度伪造检测新突破：MedForge 实现可解释伪造识别

2026年3月22日 25点热度 0人点赞 0条评论

导语：arXiv 最新论文提出 MedForge，解决医学图像深度伪造检测的可解释性难题。研究指出文本引导图像编辑可高保真篡改医学扫描，威胁临床信任与安全。MedForge 通过"先定位后分析"的预推理机制和专家指导的推理监督，在 19 种病理检测中实现业界领先准确率，同时将幻觉减少 16.2%。

核心内容

研究背景 文本引导图像编辑器（如 Nano-Banana、GPT-Image）可高保真植入或移除医学扫描中的病灶，同时保留解剖结构和采集风格线索。这类篡改可用于保险欺诈、医疗纠纷或误导诊疗，甚至能欺骗训练有素的专家。然而现有防御无法满足临床需求：医学检测器多为黑盒分类器，缺乏可解释证据；基于多模态大语言模型的解释器通常是事后解释，缺乏医学专业知识，在模糊病例上可能产生幻觉。

研究团队 论文由新加坡国立大学公共卫生学院 Zhihui Chen 等研究者出品，在 arXiv 论文中提出 MedForge，包含数据集和方法两套解决方案。

MedForge-90K 数据集 研究引入首个大规模医学伪造基准，包含 9 万张图像：3 万张真实医学图像（覆盖胸部 X 光、脑部 MRI、眼底摄影三种模态）、3 万张病灶植入图像、3 万张病灶移除图像。数据集覆盖 19 种病理类型，使用 10 种最先进的文本引导医学图像编辑模型生成伪造图像。

伪造生成流程 研究采用"作者 - 编辑 - 诊断者" refinement 循环生成高保真伪造：作者起草初始提示词，编辑器生成编辑后图像，诊断者评估是否达到预期条件且解剖学一致。如不满意，诊断者提供针对性反馈，作者修订提示词，循环直至成功。实践中作者和诊断者由 Gemini 2.5/3 Pro 实现，编辑器使用 Nano-Banana。

专家指导推理标注 研究邀请医学专家制定综合检测指南，包含两大支柱：通用原则（普适生物医学原则）和模态特异性原则（MRI、眼底、CXR 的具体约束）。标注时将这些指南注入 MLLM 提示词，强制执行三层推理机制：图像物理与纹理（检测低层异常如噪声分布不一致、修复痕迹、不自然边界）、解剖结构（验证形态学正确性如血管连续性、脑回对称性）、病理逻辑（验证高级合理性如病变是否缺乏必要继发效应）。

MedForge-Reasoner 架构 研究提出基于 MLLM 的检测器，采用"先定位后分析"的预推理机制：首先识别可疑篡改区域（如边界框），然后推理得出判决。这种约束使解释可检查，通过锚定可验证像素抑制模板复用和幻觉。研究将定位作为解释忠实度的首要约束，使接地从事后思考变为显式目标。

伪造感知 GSPO 对齐 研究采用两阶段策略（SFT 冷启动 + 伪造感知 GSPO）对齐接地和解释质量：直接奖励正确定位和证据接地推理。GSPO 使定位接地成为优化目标，将判决与可检查区域耦合，抑制幻觉推理。

实验结果 实验显示伪造感知 GSPO 使检测器与伪造推理中的事实视觉证据对齐，相比强基线将检测准确率提升 7.65%，同时将幻觉显著减少 16.2%（使用 MLLM-as-judge 协议测量）。

技术/行业洞察

这项研究反映了医学 AI 安全领域的一个关键趋势：从黑盒检测向可解释推理演进。传统医学伪造检测器输出二元决策，无法提供临床可验证证据，而 MedForge 将检测与接地推理统一，使解释可追溯至具体像素区域。

预推理机制的深层意义 在于解决事后解释的根本缺陷。现有 MLLM 解释器先做决策再生成理由，解释与证据脱节，在模糊病例上易退化为通用模板或幻觉。MedForge 强制"先定位后分析"，使推理锚定于可验证区域，从架构层面保证解释忠实度。

专家指导标注的创新价值 值得强调。通用领域解释器缺乏医学专业知识，生成的理由可能医学上不连贯。MedForge 引入医生制定的检测指南，将医学推理原则（如生物互联性、疾病演化时序）注入标注过程，使生成的解释符合临床思维。

三层推理机制的设计哲学 具有启示意义。从低层物理异常到中层解剖结构再到高层病理逻辑，这一层次化框架模拟放射科医生的诊断流程。这种结构化推理不仅提升检测性能，还使解释可被临床医生理解和验证。

与现有方案的对比 具有启示意义。MedForensics 等现有基准仅提供标签，缺乏定位证据和专家对齐推理信号；通用领域可解释检测器缺乏医学约束和显式定位接地目标。MedForge 综合这些优势，提供首个大规模医学伪造基准和配套的可解释检测方法。

伪造感知 GSPO 的战略意义 在于将接地质量直接纳入优化目标。传统 SFT 仅模仿标注文本，无法保证模型真正理解视觉证据。GSPO 通过强化学习直接奖励正确定位和证据接地推理，使模型学会"看证据说话"而非"编理由"。

从行业应用角度看，这项研究对医疗影像平台、医院 PACS 系统、保险理赔审核、医疗纠纷鉴定、远程医疗平台等场景都有直接价值。例如，在医疗影像平台场景中，系统可使用 MedForge 自动筛查上传的医学图像，识别潜在篡改；在保险理赔场景中，公司可使用 MedForge 验证索赔附带的医学图像真实性；在医疗纠纷场景中，鉴定机构可使用 MedForge 作为辅助工具评估争议图像。

然而，该方法也面临挑战。首先，医学伪造检测的对抗性持续演进——编辑模型不断改进，检测方法需持续更新。其次，跨模态泛化能力需进一步验证——当前覆盖 X 光、MRI、眼底三种模态，但 CT、超声、病理切片等模态的表现需评估。此外，临床部署需考虑假阳性影响——错误标记真实图像为伪造可能导致漏诊，需建立人机协作复核机制。