为了提高研究生的学术素养,营造浓厚的学术氛围,6月3日下午2:00,计算机与人工智能学院第六期研究生论坛在崇真南楼A北1017举办。本次论坛由19级研究生杨路明、陈亚东、田蜜、张伏红、陈志恒、张君宇主讲。本次活动由计算机学院研究生会学术部组织。
杨路明的报告题目为“基于时序分析的机器阅读理解”。他提出的模型建立在预训练模型Bert-base基础上,采用信息交互循环机制获取分段间的时序信息,并使用强化学习来划分文档。实验结果表明,较之Bert-base模型,性能有所提升,并且超过了其他对比模型。他表示,在今后的研究工作中,如何使模型在需要从多文档、跨文档提取答案的情形下达到较高的性能是值得努力的方向。
陈亚东的报告题目为“服装分类”。报告中他介绍了图像分类网络——EfficientNet和它的主要特点。然后介绍了目前他在服装分类方面的工作,包括使用Deepfashion和POG制作服装分类数据集, 以及使用vggnet、googlenet、resnet等在数据集上做的分类实验。他分享的实践经验让在座的同学都受益匪浅。
田蜜的报告题目为“基于多模态特征融合的服装推荐”。她讲到时尚服装推荐的两个目标——时尚项目的优秀兼容性和用户当前偏好的一致性。她提出了一种多模态特征融合的时尚推荐模型,它统一了时尚兼容的建模和个性化的服装建议,用以满足用户当前的需求。该模型由语义提取、专家系统和特征融合三个模块组成,改进了个性化的服装建议。
张伏红的报告题目为“NLP中的Encoder-Decoder模型”。她对Encoder-Decoder模型在应用中的两个弊端进行了详细的分析,同时针对其所存在的缺陷给出了通过引入attention机制的解决方案。在此之后,举例说明了模型在现实中的应用案例和其四种衍生模型,最后举例说明了Encoder-Decoder在具体模型中的应用。
陈志恒的报告题目为“多模态维度情感识别研究”。报告中介绍了他的具体研究内容,包括针对维度情感描述模型的优势以及多模态情感识别方法能够实现更高的预测值,本文利用深度学习模型分别对语音等,然后对训练出的特征进行决策级融合,分析效价维、唤醒维和支配维三个情感维度对应的值V、A、D以及CCC均值,对多模态维度情感识别领域展开研究。
张君宇:服装迁移任务由《Convolutional neural network architecture for geometric matching》讲起,基于TPS转换,通过卷积神经网络预测几何形变参数,实现物体的形变。《Toward characteristic-preserving image-Based virtual try-on network》采用两阶段的方法,实现服装的迁移。《Attention U-Net: learning where to look for the pancreas》空间注意力机制的合理使用,能有效提高服装迁移任务的掩码生成,从而提高迁移效果。由三篇论文,讲解服装迁移的多阶段过程和改进策略。研究的重点在于注意力机制的使用,以及自监督训练的评价指标设计。