2023年11月17日:AANet Adaptive Aggregation Network for Efficient Stereo Matching
- 主页 /
- 通知公告 /
- 通知公告
2023年11月17日:AANet Adaptive Aggregation Network for Efficient Stereo Matching
【报告内容】
汇报人:周玉航
汇报单位:河海大学
主题:《AANet Adaptive Aggregation Network for Efficient Stereo Matching》
1、Introduction
2、Methods
3、Experiment
4、Conclusion
【报告总结】
1.待解决的问题
当前最先进的立体匹配网络大多基于 3D 卷积,其计算复杂度和高内存消耗使得在实际应用中部署成本非常高。如PSM-Net在高性能GPU上也需要4G的内存和410ms来处理一对KITTI图片。GA-Net意识到了3D卷积的弊端,用SGA和LGA尝试替代3D卷积,但是仍然使用了15个3D卷积。
2.相关创新方案
作者通过设计两个有效且高效的成本聚合模块:自适应同尺度聚合模块(Adaptive Intra-Scale Aggregation)和自适应跨尺度聚合模块(Adaptive Cross-Scale Aggregation)来实现成本聚合。并且使用特征相关性而不是连接的方式构造Cost Volume。
3.实验总结
消融实验:
1)表明ISA模块和CSA模块都能提升视差估计的精度,两者结合效果最佳。
2)在SceneFlow测试集上的可视化结果表明AANet在薄结构和无纹理区域中产生更好的视差预测。
泛化性能:
1)使用KITTI微调的 AANet 在 Middlebury 2014 数据集测试泛化能力。结果显示,与 PSMNet 模型相比,AANet 产生更清晰的对象边界并更好地保留整体结构。
2)与3D卷积的比较AA模块可以有效提高网络的性能,而且计算量更少,速度更快,占用内存更少。相比于3D卷积,AA模块更加的高效和有效。经过复杂度分析,可变形卷积层的计算复杂度小于3D卷积层的1/130。
3)作者的方法在准确性和速度之间取得了更好的平衡,在对象边界产生了更好的结果。
4. 结论
3D 卷积的确是基于 cost volume 立体匹配方法的痛点,想要让立体匹配更高效,少用或者不用 3D 卷积是一个很好的解决思路。从立体匹配提速角度看,之后的研究可以从如何替代 3D 卷积,或者如何减少 3D 卷积的入手。其他相似领域角度看,如何将这种思路应用到高分辨率立体匹配,多视角立体视觉(MVS),光流估计,基于双目的 3D 检测等领域。
报告时间:2023年11月17日19:30
腾讯会议:371 3868 6615
点我下载本讨论课相关文献或PPT吧~(提取码:iipr)