张印辉 庄宏 何自芬 杨宏宽 黄滢

张印辉, 庄宏, 何自芬, 杨宏宽, 黄滢. 氨气泄漏混洗自注意力轻量化红外检测[J]. 中国光学(中英文), 2023, 16(3): 607-619. doi: 10.37188/CO.2022-0127
ZHANG Yin-hui, ZHUANG Hong, HE Zi-fen, YANG Hong-kuan, HUANG Ying. Lightweight infrared detection of ammonia leakage using shuffle and self-attention[J]. Chinese Optics, 2023, 16(3): 607-619. doi: 10.37188/CO.2022-0127
基金项目: 国家自然科学基金(No. 62061022,No. 62171206,No. 61761024)



  • 中图分类号: TP391

Lightweight infrared detection of ammonia leakage using shuffle and self-attention

Funds: Supported by National Natural Science Foundation of China (No. 62061022, No. 62171206, No. 61761024)
  • 摘要:

    氨气是重要的基础工业原材料,实现其非接触探测对于及时发现氨气泄漏,避免重大安全事故发生具有重要意义。针对常规氨气泄漏检测装置需等到氨气扩散到一定范围并与传感器接触时才能响应的不足,提出一种混洗自注意力网络(SSANet)模型实现氨气泄漏红外非接触检测。因红外热像仪获取的氨气泄漏图像含噪高、对比度低,故通过非局部均值去噪、限制对比度的自适应直方图均衡化预处理建立氨气泄漏红外检测数据集。SSANet模型在YOLOv5s基础上通过K-means算法聚类分析出适用于氨气泄漏红外检测的候选框以预置模型参数;采用轻量级ShuffleNetv2网络,将其Shuffle Block中的3×3的深度可分离卷积核替换为5×5,采用含有新卷积模块的SK5 Block对特征提取网络进行重构,使模型大小、计算量和参数量实现轻量化的同时提高检测精度;采用Transformer模块代替原网络瓶颈模块中的C3模块实现泄漏区域多头注意力自底向上融合,实现检测精度的再次提升。实验结果表明,SSANet模型较YOLOv5s基础模型大小和参数量分别减少76.40%、78.30%,降为3.40 M、1.53 M;单张图像平均检测速度提升1.10%,达到3.20 ms;平均检测精度提升3.50%,达到96.30%。本文为开发氨气泄漏非接触探测装置以保障涉氨企业的安全生产和稳定运行提供了一种有效的检测算法。


  • 图 1  SSANet 模型总体架构

    Figure 1.  The overall architecture of the SSANet model

    图 2  红外氨气泄漏真实框变化图

    Figure 2.  Change diagram of a real frame of infrared ammonia leakage

    图 3  氨气泄漏红外检测数据集候选框高宽比可视化结果

    Figure 3.  Visualization results of the height/width ratio of the anchor in ammonia leak infrared detection data

    图 4  通道混洗实现方式

    Figure 4.  Implementation of channel shuffling

    图 5  SK5 Block模块结构

    Figure 5.  SK5 Block module structure

    图 6  Transformer模块结构图

    Figure 6.  Structure diagram of Transformer block

    图 7  Transformer编码层结构图

    Figure 7.  Transformer encode structure diagram

    图 8  不同方法处理后的增强效果对比图

    Figure 8.  Comparison of enhancement effects by different methods

    图 9  SSANet模型最终检测结果

    Figure 9.  The final test results of the SSANet network model

    表  1  聚类前后3个检测层初始候选框尺寸情况

    Table  1.   Initial candidate frame sizes of the three detection layers before and after clustering

    表  2  超参数配置

    Table  2.   Hyperparameter configuration

    表  3  图像预处理的定量评价指标

    Table  3.   Objective evaluation indicators of image preprocessing algorithms

    表  4  图像预处理前后网络性能对比

    Table  4.   Comparison of network performances before and after image preprocessing

    模型Params/MModel size/MSpeed/msmAP/%
    表  5  聚类前后网络性能对比

    Table  5.   Comparison of network performance before and after clustering

    模型Params/MModel size/MSpeed/msmAP/%
    表  6  不同特征提取网络评估指标对比

    Table  6.   Comparison of evaluation indicators for different backbone networks

    表  7  不同BottleNeck结构网络性能对比

    Table  7.   Comparison of network performance of different BottleNeck structures

    表  8  不同模型精度对比

    Table  8.   Accuracy comparison of different models

    ModelGFLOPsParams/MModel size/MSpeed/msmAP/%
