2025年12月19日:EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation

  • 主页 /
  • 通知公告 /
  • 通知公告

2025年12月19日:EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation

【报告内容】

汇报人: 陈弘毅

汇报单位:福建理工大学

主题:EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation

1、Introduction

2、Method

3、Experiments

4、Conclusion

【报告总结】

1.待解决的问题描述

三维医学图像分割在临床诊断和治疗规划中具有重要意义,但仍面临多方面挑战。一方面,3D 医学图像具有体数据规模大、分辨率高的特点,传统基于 Transformer 的方法由于自注意力机制的二次复杂度,在计算量和显存占用上难以高效扩展;另一方面,器官形态在空间上呈现明显的多尺度特性,大器官强调整体结构一致性,而小器官及细长结构则对局部细节和边界信息高度敏感。现有方法往往难以在保持全局结构建模能力的同时,有效兼顾复杂边界和小目标分割精度。此外,部分基于 Mamba 或状态空间模型的方法虽然在效率上具有优势,但在视觉任务中对空间结构与频率特征的显式建模能力仍然不足。

因此,如何在保证高效计算的前提下,同时提升 3D 医学图像分割中对全局结构与局部细节的建模能力,是本文试图解决的核心问题。

2.相关创新方案

针对上述问题,本文提出了一种基于 Mamba 的高效 3D 医学图像分割网络 EM-Net,从通道建模和频率建模两个互补角度对特征表达进行增强。

首先,本文设计了 CSRM(Channel Squeeze-Reinforce Mamba)模块。该模块通过通道压缩与重建机制,引导网络关注更具判别力的通道特征,并利用共享权重的 Mamba 层在通道维度上建模长程依赖关系,从而增强语义层面的全局一致性,减少冗余特征对分割结果的干扰。

其次,本文在 CSRM-F 模块中引入了 EFL(Efficient Frequency Learning)层。EFL 通过将 3D 空间特征映射至频域,在频域中对不同空间频率成分进行可学习的加权选择,再通过逆变换回到空间域,从而显式建模多尺度信息分布。该设计能够有效强化低频的全局结构信息,同时保留并增强与复杂边界和小器官相关的高频细节。

通过 CSRM 与 EFL 的协同作用,EM-Net 在通道语义一致性和空间尺度建模两个层面实现互补增强,在保证计算效率的同时提升了分割精度。

3.实验总结

本文在 Synapse 等标准 3D 医学图像分割数据集上进行了系统实验评估。实验结果表明,EM-Net 在 Dice 系数(DSC)和 Hausdorff 距离(HD/HD95)等关键指标上均优于多种主流方法,包括基于 Transformer 的 Swin-UNETR 以及部分 Mamba 结构网络。

在定量指标方面,EM-Net 在保持较低参数量和 FLOPs 的前提下,实现了更高的分割精度和更快的训练速度(TS),体现了其在效率与性能之间的良好平衡。在定性可视化结果中,EM-Net 在复杂器官边界、小器官及细长结构区域表现出更好的连续性与边界一致性,验证了 CSRM 和 EFL 模块在实际分割场景中的有效性。

消融实验进一步证明了各个模块的独立贡献,说明通道级语义建模与频率域特征选择在 3D 医学图像分割任务中具有互补优势。

4.未来工作

尽管 EM-Net 在性能和效率方面均取得了较好的效果,但仍存在进一步提升的空间。未来工作可以从以下几个方面展开:

一是探索更精细的频域建模策略,例如引入自适应频率分组或跨通道频率交互,以进一步增强对复杂结构的表达能力;二是将 EM-Net 扩展至更多医学影像模态和任务,如多模态 MRI 分割或时序 4D 医学图像分析,以验证模型的通用性;三是结合轻量化设计与模型压缩技术,推动该方法在实际临床场景中的高效部署。

报告时间:2025121919:30

腾讯会议:311-5999-8176

点我下载本讨论课相关文献或PPT吧~(提取码:iipr)