2024年11月15日下午19点,计算机与人工智能学院第五十期研究生学术论坛在崇真楼南楼A4030成功举办,本次论坛由2022级研究生周畅,2023级研究生刘锐,2022级研究生王海鹏,2023级研究生时佳乐与彭志宏主讲,学院研究生会主办,学院唐奔宵博士出席了该论坛。
周畅同学分享的主题为“Enhancing Drug Repositioning through Local Interactive Learning with Bilinear Attention Networks”。 药物重新定位是一种识别现有药物新治疗应用的有效策略。在本研究中,他们提出了DRGBCN,一种整合异构信息的深度学习模型,通过图卷积网络和双线性注意机制捕捉药物与疾病的复杂交互关系。模型通过十折交叉验证在三个公开数据集上获得了平均0.9399的AUROC,并在膀胱癌和急性淋巴细胞白血病的案例研究中展现了实际应用潜力。此外,药物-疾病网络分析揭示了社区内相似药物的成功聚类,为药物-疾病相互作用提供了新的见解。
刘锐同学分享的主题为“GCAT: Global Channel Attention Enhanced Multi-Scale Location for Object Tracking”。 多头注意力机制是 Transformer 跟踪算法的核心,主流的 Transformer 跟踪算法倾向于增加注意力头的数量,获取更丰富的特征信息。然而部分注意力头功能重复,在不同特征通道产生了相似的注意力,间接削弱了重要特征的表达。针对上述问题,他提出一种去冗余的Transformer 单目标跟踪算法(GCAT),该算法通过 MixFormer跟踪器获取不同层次的特征信息,设计一种特征增强网络,用于细粒度地抑制冗余的特征通道。构建一个多尺度定位头,融合不同层次的特征信息,从而准确定位不同尺度的目标。实验结果表明,GCAT 在 LaSOT、UAV 123 等公开数据集上实现了最佳性能,在仅使用 GOT-10K 训练集的前提下,相比基准算法 MixFormer,在 AUC 指标提高了 1.9 个百分点,PNorm指标提升了2 个百分点,P 指标提升了2.2 个百分点。
王海鹏同学分享的主题为“Multi-View Contrastive Learning for Recommendation via Adaptive Augmentation”。他们提出了一种新颖的基于自适应增强的多视图对比模型,旨在提升用户项目嵌入表示的质量同时缓解流行偏见与交互噪声问题。模型包含互补图构建、自适应增强和多视图对比三个关键模块。通过合理调整图结构,使方法更适用于推荐任务。同时,巧妙地融合视图内和视图间数据,全面捕捉用户多样的兴趣特征。与现有方法相比,他们的模型在广泛采用的数据集上表现出色,并通过消融实验验证了各模块的有效性。
时佳乐同学分享的主题为“基于动作检测的身份认证系统研究”。 针对惯性测量单元传感信号分类模型因可穿戴设备获取数据时易缺少,面临着鲁棒性差等重要表征问题,提出一种利用伸手抓握门把手动作进行身份认证的系统。首先,通过MLA从日常动作中提取一致性特征信息和利用互补滤波器获取到开门动作中多样性特征信息。其次,利用神经网络从获取到的日常动作信息中识别出开门动作。最后,在具有三层增强模块的模型中进行身份认证。结果表明,在动作识别任务上准确率达到98.4%,在身份认证任务上取得97.5%的准确率。并利用DTW算法在时间跨度上进行比较以及进行对比实验,证明了该系统的现实可行性。
彭志宏同学分享的主题为“HOOD: Hierarchical Graphs for Generalized Modelling of Clothing Dynamics”。 HOOD 研究了一种通用的服装动态建模方法,利用图神经网络和多层消息传递,实现对紧身和宽松服装的实时预测。通过分层消息传递方案,有效传播刚性拉伸模式,同时保留局部细节。实验结果表明,HOOD 在定量上优于强基线方法,其结果被认为比最先进的方法更逼真。此外,该方法在处理复杂服装动态时表现出色,能够生成高质量的模拟效果,为虚拟试衣和动画制作提供了新的可能性。