问答 店铺
热搜: ZYNQ FPGA discuz

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

微信扫一扫 分享朋友圈

已有 20 人浏览分享

开启左侧

基于YOLO11算法的人脸检测模型训练项目

[复制链接]
20 0
1.项目介绍

该项目基于YOLO11目标检测框架进行架构优化,通过引入Squeeze-and-Excitation(SE)注意力模块增强特征通道间的依赖关系,同时新增P2检测层提升小尺度人脸目标的检测精度。使用WIDERFace数据集进行训练,并以yolo11n.pt预训练模型作为基础,在保持较高检测准确率的同时显著降低模型复杂度与计算开销。得到一个轻量化人脸检测模型,支持高效推理,适用于移动端、嵌入式设备等资源受限场景的部署需求。


2.YOLO11网络结构的改进
2.1.SE模块的介绍
SE的主要思想是通过对输入特征进行压缩和激励,来提高模型的表现能力。具体来说,SE注意力机制包括两个步骤:挤压(Squeeze)、激励(Excitation)。
SE模块的结构:
image.jpg

SE 模块主要包含 Squeeze 和 Excitation 两部分。W,H 表示特征图宽,高。C 表示通道数,输入特征图大小为 W×H×C。

SE注意力机制的实现步骤如下:
(1)     Squeeze:通过全局平均池化,将每个通道的二维特征(H*W)压缩为1个实数,将特征图从 [h, w, c] ==> [1,1,c]。
(2)     excitation:给每个特征通道生成一个权重值,论文中通过两个全连接层构建通道间的相关性,输出的权重值数目和输入特征图的通道数相同。[1,1,c] ==> [1,1,c]。
(3)     Scale:将前面得到的归一化权重加权到每个通道的特征上。论文中使用的是乘法,逐通道乘以权重系数。[h,w,c]*[1,1,c] ==> [h,w,c]。
2.2.P2检测头介绍
P2检测头的设计原理:‌
(1)空间分辨率优势‌:P2层特征图的分辨率是输入图像的1/4(如640x640→160x160),相比P3层(1/8)保留更多小目标细节,显著改善小目标漏检问题。‌
(2)特征提取增强‌:通过浅层高分辨率特征直接输出检测结果,避免深层特征因下采样丢失小目标信息。
3.Wider Face数据集简介
根据你自己的需求选择适合的数据集,这里选择Wider Face数据集进行演示示例。
根据官网的介绍,Wider Face数据集最早是在2015年公开的(v1.0版本)。WIDER FACE数据集是一个人脸检测基准数据集。WIDER FACE数据集基于61个事件类进行组织。对于每个事件类,随机选择 40%/10%/50% 的数据作为训练、验证和测试集。在WIDER FACE数据集中,类别数量为1,该数据集仅包含‌单一类别。
image.jpg
WIDER FACE数据集的目录结构如下:

image.jpg

4.演示效果
image.jpg

百度网盘提取:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0

关注

0

粉丝

5

主题
精彩推荐
热门资讯
    网友晒图
      图文推荐
        
        • 微信公众平台

        • 扫描访问手机版