2025年9月12日下午2时,计算机与人工智能学院第六十期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2023级研究生葛龙龙、尹春晓、彭志宏、伏嘉豪主讲,计算机与人工智能学院研究生会学术部主办,学院阮晓莉老师出席了该论坛。
葛龙龙同学分享的主题为“HPRNet: Human Parsing Reconstruction with Non-Local Multi-Scale Perception Network for Cloth-Changing Person Re-ldentification”。换装行人重识别是一项具有挑战性的任务,旨在匹配不同服装下的行人,现有方法由于过度依赖外观重建和忽视结构上下文,往往无法保持身份关键线索。为了解决这个问题,他们提出了HPRNet,一个集成了非局部加权多尺度感知(NWMP)和解析重建探索(PRE)模块的新型框架。NWMP捕获长程空间依赖关系和非相邻区域间丰富的上下文关联,而PRE利用人体解析来重建语义身体部位,有效地将服装相关特征与身体形状和步态等身份关键特征区分开来。他们在LTCC、PRCC和CCVID基准数据集上的大量实验表明,HPRNet通过在显著服装变化下保持内在身份信息,达到了具有竞争力的最先进性能。
尹春晓同学分享的主题为“Leveraging Data Drift to Optimize Differential Privacy in Federated Learning via Dual-Mode Switching”。联邦学习(FL)是一种分布式机器学习范式,它使多个客户端能够协作训练共享模型,同时将数据保存在本地。在实际部署中,FL仍然容易受到隐私攻击,这可能导致敏感信息泄露。差分隐私(DP)在FL中被广泛采用来缓解此类风险,但往往以降低模型性能为代价。现有的DP方法仅通过考虑噪声对模型性能的直接影响来优化隐私-效用权衡,忽略了在FL分布式训练过程中自然发生的显著数据漂移。这种数据漂移本身就会降低模型性能,而额外的DP噪声进一步加剧了这种退化,严重损害了模型收敛性和准确性。为解决该问题,她们提出了一种名为双模式切换差分隐私(DSDP)的新型DP框架,该框架利用数据漂移来提高模型性能,同时保持强隐私保证。她们在四个基准非独立同分布数据集上的大量实验表明,DSDP在模型准确性方面优于最先进的DP方法,包括DP-FedProx、PrivateFL和NbAFL。此外,在模型投毒和梯度泄漏攻击下,DSDP在隐私和效用之间实现了卓越的平衡,同时表现出强大的鲁棒性。
彭志宏同学分享的主题为“Physics-Aware Lighting Gaussian-Embedded-Mesh Avatars from Monocular Video”。从单目RGB图像重建可控制、高保真的3D人体化身在实时远程呈现和VR应用中仍然具有挑战性。他们提出了一个增强的高斯嵌入网格(GEM)框架,将各向异性高斯基元锚定到可变形的SMPL三角形上,并使用线性混合蒙皮进行姿态驱动变形。基于物理的光照模块分离漫反射、镜面反射和环境反射,实现准确的视角相关着色。轻量级姿态精化网络结合网格正则化处理非刚性运动。通过光度损失、平滑损失和物理损失的联合优化,提高了纹理保真度和姿态准确性。在ZJU-MoCap和PeopleSnapshot数据集上,他们的方法在RTX 3090上以55 FPS的速度达到了30.68 dB PSNR(新视角)和30.76 dB(新姿态),在PSNR/SSIM/LPIPS指标上优于先前的工作。
伏嘉豪同学分享的主题为“SD-GASNet: Self-Distillation Based Frequency Domain Information Gathering-and-Allocation Mechanism for Surface Defect Detection”。他们的论文介绍了SD-GASNet方法,一种用于表面缺陷检测的新型网络,该网络解决了在复杂背景下识别大尺度变化缺陷的挑战,特别是在有限计算资源条件下。为了处理复杂缺陷,他们提出了一个AES-FPN融合网络,该网络具有FIGA机制来提取和利用特征中的多频信息,以及CS模块来防止特征融合过程中的信息丢失。为了解决计算限制问题,他们采用了自蒸馏模型压缩策略,配合新的蒸馏损失函数来提升轻量级模型的性能。实验结果表明,SD-GASNet在准确性以及准确性与速度的平衡方面都超越了当前最先进的模型。