2023年12月12日下午16点,计算机与人工智能学院第三十八期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2021级研究生王子樊、金钰馨2022级研究生王赞、李政龙主讲,学院研究生会主办,学院唐贤方老师出席了该论坛。
王子樊同学分享的主题是:基于传感器数据的人体行为识别研究。对目前的人体行为识别方法进行讨论。首先对基于传感器数据的人体行为识别背景进行了介绍,说明其研究的价值和意义,然后对行为识别技术步骤进行简单的描述,紧接着阐述了深度学习和机器学习在该领域的研究内容。根据目前存在的模型性能低的问题,提出了融合时间卷积和注意力机制网络,并且采用知识蒸馏模型压缩方法,实现模型的轻量化部署模型,最后通过实验评估了模型的准确性和可靠性,并将其部署于移动端上。
金钰馨同学分享的主题是:扩散模型在图像生成领域的综述。对最近流行的用于图像生成的扩散模型进行了回顾,按照任务形式将它们分类。首先说明了扩散模型的基础概念和广泛使用的通用模型DDPM和LDM。然后,从是否需要条件生成将现有工作分为无条件生成和条件生成两类。随后,通过实现任务类型对各项工作进行总结归纳。对于进一步研究方向,未来需要能有一个公认的评估框架,和明确且多样化的评估标准、指标。能将文本到图像的扩散模型与活跃研究领域如最近很火热的自然语言处理领域的ChatGPT相结合的研究是很令人期待的。
李政龙同学分享的主题是:Graph Heterogeneous Multi-Relational Recommendation。针对多类型交互的异构关系进行建模的,即点击、加购、购买等行为,将每一种行为作为一个子任务进行建模,最后通过多任务学习框架进行损失函数构建。在构建图信息传播的过程中,不仅仅采用节点上的信息,同时采用边的信息,进一步加强了不同信息的举个。并且,在损失函数构建时,采用不采样的方式改写损失函数,从而只需要用到正样本的集合就能进行训练,节省了时间。
王赞同学分享的主题是:Pastiche Master: Exemplar-Based High-Resolution Portrait Style Transfer。对GAN的部分经典变体模型进行了回顾,并详细介绍在CVPR 2022上由商汤科技-南洋理工大学联合实验室S-Lab的研究者提出的基于双路风格的人像风格化模型DualStyleGAN;该模型针对现有的人脸风格化方法无法在小规模数据上实现基于样例的高清人脸风格化的问题,在StyleGAN的基础上添加外部风格控制模块,构建全新的双路风格生成网络DualStyleGAN。通过渐进微调的迁移学习方法在小规模数据上学习外部风格,能够有效地模仿艺术人像的画风,实现基于样例的高清人脸风格化。