【学术论坛】计算机与人工智能学院成功举办第四十六期研究生学术论坛

来源: 作者:宣传部编辑人:罗园发稿时间:2024-09-13浏览次数:

2024年9月12日下午16点,计算机与人工智能学院第四十六期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2022级研究生沙华铃、王子澳、彭德朗,2023级研究生官文俊、胡鑫主讲,学院研究生会主办,学院程君老师出席了该论坛。

沙华铃同学分享的主题为“Multiscale Feature Extraction and Attention Mechanism Generative Adversarial Network for Super-Resolution and Deblurring of Fundus Images”。眼底图像超分辨率是一个具有挑战性的问题。目前存在的几类模拟眼底图像低质量成因的退化模型并不能很好地模拟现实中的复杂退化情况。为了解决这些问题,他们设计出一个新的退化模型用来模拟在复杂成像环境中的图像的低质量成因。然后,他们研究提出了一种眼底图像增强与超分辨率的方法,通过一个新颖的生成器来恢复眼底图像中的细节,对图像进行2倍或4倍的超分辨率并还原图像中未知因素造成的干扰。

ADF045E668715B5E00C426CCA000C836

王子澳同学分享的主题为“基于多模态学习的点云分类网络”。针对由于点云数据的无序性、稀疏性和复杂性导致传统三维点云分类网络参数量庞大,训练效率低下的问题,他们提出了一种基于多模态学习的点云分类网络模型MPC-CLIP。将原始点云数据投影成二维深度图;然后利用二维CLIP中训练好的文本和图像编码器分别提取点云特征,将每个文本和图像特征进行加权求和并计算余弦相似度,进而得到零样本分类结果。使用经典点云数据集ModelNet40进行零样本分类与消融实验,并且将MPC-CLIP与多个经典3D点云分类模型进行融合。总体分类精确度提升了0.8%~1.7%,证明了MPC-CLIP 模型的有效性和鲁棒性。。

CA6FFED6DA6436AB60F0BEEB92429A67

官文俊同学分享的主题为“How to build an EEG dataset and analyze it”。脑机接口是一种直接连接人脑与外部设备的技术,它使得思维可以直接控制机器或计算机系统,为残疾人士、神经康复、虚拟现实、增强现实等领域提供了新的可能。他探讨了如何利用脑机接口建立脑电数据集及其分析方法。介绍了脑电数据集的构建过程,包括实验设计、数据采集、预处理和标注等关键步骤。详细阐述了脑电数据分析的技术路线,包括信号处理、特征提取、分类识别等环节,强调了在建立和分析脑电数据集过程中应注意的问题,如数据质量、个体差异和伦理规范。简单介绍了几种算法在他们建立的数据集上的作用。。

0474A4E21398930C6D7B1C834F30FE25

胡鑫同学分享的主题为“Exploring multispectral reconstruction based on camera response prediction”。基于数码相机的光谱重建技术已成为获取高空间分辨率光谱图像的关键方法之一。尽管当前的研究在可控条件的实验室环境中已经取得较高精度,但在开放环境下应用时,光源的变化、光照不均匀性以及成像参数的变化,均导致成像条件的不稳定,使得专为特定成像条件设计的光谱重建模型难以适应多变的成像环境。为此,他们研究提出基于相机raw响应值预测的多光谱重建新方法,以数码相机成像模型为基础,通过预测训练样本集在任意成像条件下的raw响应值,对相机进行光谱特性化建模,然后对相应成像条件下的对象进行光谱重建。研究测试了不同曝光时间和ISO组合下ColorChecker色卡的raw响应值预测结果,并利用ColorChecker SG色卡对ColorChecker 24色色卡进行了光谱重建测试。实验结果表明,在不同成像条件下,利用预测响应值对真实拍照响应值的光谱重建的平均均方根误差RMSE(%)为4.19,平均CIEDE2000色差为5.61,为开放场景下的多光谱重建提供了一种可行的参考方案。

05719D79F08055B62843C9DDDF0A2030

彭德朗同学分享的主题为“DS-Seq: Deriving smooth 3D human motion sequences from video time cues”。将基于单帧图像的人体三维姿态与形状重建方法应用于视频时,由于单帧重建精度不够以及当前帧、过去帧、未来帧信息利用不均衡,无法恢复高精度、平滑的三维人体运动,导致生成的人体运动出现不规则的抖动。针对这一问题,他们研究提出了一种网格恢复系统(DS-Seq),通过利用更高精度的二维特征检测框架,并利用基于时间特征的运动约束框架平等吸收过去帧和未来帧的信息,他们研究的DS-Seq可以重建平滑的三维人体运动。此外, DS-Seq实现的每帧三维姿态与形状的精度比目前最先进的方法TCMR高出10%以上。

4A9387AF545C06E2606337106068310F