针对智慧课堂中非配合式遮挡难题,从检测与识别双维度协同优化,构建端到端级联系统,在真实课堂场景下实现 83.1% 综合识别准确率。
书本、手部、口罩等遮挡物覆盖面部关键区域,导致有效像素减少、关键特征点缺失,传统模型极易漏检或误检。
教室后排学生人脸尺度极小,密集分布下特征信息有限,多次下采样后微弱特征面临被彻底滤除的风险。
遮挡区域引入大量冗余干扰信息与背景噪声,严重干扰有效身份特征提取,导致类内距离增大引发误判。
传统随机遮挡生成方法位置不符合物理逻辑,遮挡物与面部光影色彩不协调,导致增强样本质量低下。
在 YOLO11n 基础上集成以下核心改进:
实现无损下采样,重组空间信息至通道维度,避免传统跨步卷积导致的特征丢失。
构建高效跨层交互机制,实现深层语义与浅层细节的深度融合与优势互补。
利用未遮挡区域动态补偿遮挡部分的响应值,自适应放大关键区域特征权重。
构建包含 8 类课堂常见遮挡物的素材库,结合 HSV 色彩匹配与 Alpha 羽化,保证合成样本逼真且符合物理逻辑。
SMSA 提取多尺度空间特征抑制噪声,PCSA 计算跨通道语义依赖补偿身份信息。嵌入 IR-50 保持原始拓扑。
海康威视摄像机采集 1920×1080 课堂图像,30 秒间隔帧采样
全局扫描定位所有人脸边界框,增强遮挡感知
分辨率过滤(≥40px)→ 边界扩展(1.3×)→ 双线性插值至 112×112
SCSA 注意力增强特征提取 → 余弦相似度比对 → 身份判定
改进 YOLO11n 在 Hard 子集上显著提升。
在遮挡测试集上较基准模型大幅提升。
真实课堂图像帧识别率提升 6.9 个百分点。