2025年2月26日下午14点,计算机与人工智能学院第五十四期研究生学术论坛在崇真楼南楼A4030成功举办,本次论坛由2023级研究生苏壮壮、杨学周、吴枫,2022级研究生何如一、邓云龙主讲,学院研究生会主办,学院杨华利老师出席了该论坛。
苏壮壮同学分享的主题是“Research on Ethnic Garment Detection Algorithm Based on lmproved YOLOv8”,主要围绕少数民族服饰识别展开。如今,少数民族服饰在现代化进程中面临逐渐消失的风险,如何借助科技手段实现高效、准确识别成为关键问题。基于这一现状,他提出基于改进 YOLOv8 模型的方法。他先是收集各民族服饰相关资料,制作新的目标检测数据集,同时引入 CSPPC 结构和 MSDA 机制优化模型,实现了模型的轻量化和检测精度的提升。实验结果表明,改进后的 YOLOv8 模型在准确率、召回率和 F1 值上均优于基准 YOLOv8 模型,在参数量和精确率上也超过 YOLOv11 模型,能有效进行少数民族服饰图像分类,为民族服饰的信息化处理和文化传承保护提供有力支持。
杨学周同学分享的主题为“TSA-Net: A Spatio-Temporal Feature Enhanced Algorithm for Power Risk Behavior Recognition”,聚焦于电力作业现场的行为识别。电力作业现场环境高危,精准识别作业人员行为至关重要。针对目前存在的时空特征融合不足、时空信息提取不足和全局特征建模不足等问题,他提出基于时空特征增强的电力风险行为识别算法,分别构建自适应时空特征融合模块、空间定位映射模块和特征优化预测头。基于真实电力作业视频构建的数据集实验显示,TSA-Net 在识别 11 类典型行为时,平均准确度和 Top1 Precision 分别达到 62.1% 和 92.5%,与现有算法相比,他的方法在精度和鲁棒性上优势显著。
何如一同学分享的主题是 “Improving Adversarially Robust Sequential Recommendation through Generalizable Perturbations”,重点研究序列推荐模型的防御算法。现有的序列推荐模型易受各种攻击影响,且现有的对抗性防御算法存在误差传播、泛化性难保持和噪声特征等问题。他针对这些问题,提出创新的防御算法。该算法利用基于多层感知机的扰动生成模块创建对抗性样本,无需梯度估计;将生成模块与编码器映射模块结合,使模型更好应对数据微小变动;还把级联信息过滤融合扩散模型连接至信息瓶颈层,逐步去除非鲁棒性项目和特征,并提升模型泛化能力和鲁棒性。
吴枫同学分享的主题为 “SSL-MlAD: A Self-Supervised Learning Network for Multimodal Industrial Anomaly Detection”,主要探讨工业异常检测问题。当前,基于 RGB 图像和 3D 点云的多模态异常检测方法存在预训练模型依赖、庞大内存记忆库导致资源消耗和推理时间增加等问题。他提出一种自监督学习的多模态重建框架,该框架包含分层的 2D - 3D 嵌入模块、联合编码器和带有模态共享与特定组件的解码器,用于 RGB 图像和 3D 点云的重建与特征提取。实验表明,他们的方法在 MVTec3D - AD 和 Eyescandies 数据集上优于以往最先进方法,并且能够显著降低计算资源消耗,提升实时性能。
邓云龙同学分享的主题是 “Scalable watermarking for identifying large language model outputs”,他介绍了一种新的水印方法。SynthID - Text 是一种可用于生产的水印方法,适用于大型语言模型(LLM)生成的文本。该方法在生成过程中微妙改变文本,能在不影响文本质量和LLM 性能的情况下高效检测合成内容。与其他方法不同,SynthID - Text 检测时无需访问原始 LLM,还能与推测性采样等现有生产技术无缝集成,支持大规模部署。经过广泛测试,包括近 2000 万条 Gemini 响应的实时实验,证实了上述方法的有效性以及对质量的最低影响,这项技术旨在通过识别合成文本并减轻潜在误用,促进负责任的LLM使用。