2024年10月18日19点,计算机与人工智能学院第四十八期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2022级研究生赵高荣、李思维、胡子奇,2023级研究生张思莹主讲,学院研究生会主办,学院钟赛尚老师出席了该论坛。
赵高荣同学分享的主题为“HearDrinking: Drunkenness Detection and BACs Predictions Based on Acoustic Signal”。酒精中毒是一种因过量饮酒引发的严重健康问题,需要有效监测。传统检测系统通常依赖额外硬件或复杂操作,实用性较低。为此,他们提出了HearDrinking,一个基于智能手机的免设备、抗噪声醉酒检测系统。该系统通过手机麦克风记录语音活动,提取醉酒相关特征,实现准确检测。语音易受环境噪声干扰,为提升抗噪声能力,HearDrinking采用多模态融合方法进行语音活动检测,并通过计算对数梅尔频谱图获取时间和频谱信息。他们结合动态卷积ODConv与ShuffleNetV2,创建OD-ShuffleNetV2网络,增强对数梅尔谱图特征提取。实验结果显示,该系统醉酒检测平均准确率达96.08%,血液酒精浓度预测平均误差为5mg/dl。
李思维同学分享的主题为“QualiFit: A Quality of Fitness Execution System with Wearable Sports Kneelet”。自新冠疫情以来,居家锻炼逐渐受到欢迎。然而,缺乏专业健身教练的指导,参与者可能会面临更高的受伤风险以及不理想的锻炼表现。现有的健身活动指导系统往往缺乏更直观和全面的指标来帮助用户更好地理解和评估他们的锻炼效果。此外,这些系统依赖于集中的数据收集和集中训练模型的方法,可能违反数据隐私法规和限制系统对新用户的泛化性能。在本文中,他们提出了QualiFit,一个健身辅助系统,其利用集成惯性测量单元(IMU)的可穿戴运动护膝为基于弯曲角度和基于抬腿高度的运动提供全面的健身质量评估和更直观的表现反馈。此外,QualiFit不仅实现了隐私保护,还实现了系统对新用户可观的泛化性能。具体来说,QualiFit将每个用户视为不同的任务,并以联邦方式对全局中心网络进行元训练,以学习共享特征表示,而无需直接共享用户数据,从而保护用户隐私。这些学习到的特征标示可以有效地推广到任何单个用户。随后,在中心网络学习的特征表示的基础上通过自适应过程获得个性化的本地模型。他们从局部和全局的角度对健身质量进行了评估,以帮助用户提高运动表现。最后,本文在10名参与者6种健身动作共近24000次重复的健身数据上进行了广泛实验,QualiFit在动作类型分类方面达到了100%的平均准确率,在用户表现水平识别方面达到了95.73%的平均准确率。此外,在基于弯曲角度和基于抬腿高度的完成度回归任务中达到平均绝对误差(MAE)分别为0.3775和0.8079。
胡子奇同学分享的主题为“Highlight removal of single image based on diffusion model”。检测和去除镜面高光是一项复杂的任务,可以增强现实环境中的各种视觉任务。尽管以前的工作取得了很大的进展,但它们往往会忽略镜面高光区域或产生不理想的效果,例如颜色失真等视觉伪影。针对这些问题,他们提出了一种基于扩散模型的高光去除框架。每次采样迭代过程包括动态掩模感知扩散模型和数据一致性模块。 DMDM的主体是一个U-Net,用于在预测噪声图像的同时逐渐细化mask,经过t次迭代后得到最终的无高光图像和细化后的高光mask。他们在公开的SHIQ数据集上对所提出的方法进行了评估,并通过对实验结果的对比分析证明了其优越性。
张思莹同学分享的主题为“综合半参数变系数和GRNN神经网络的对流层天顶延迟模型”。本研究将对流层分析与半参数核估计的理论相结合,提出了一种融合半参数变系数与神经网络技术的新型对流层模型。将频谱分析中提取的主要周期信号作为参数部分,并将半参数核估计中的非参数概念应用于处理剩余周期信号和其他随机误差,从而建立了一个基于半参数核估计的对流层天顶延迟模型。为了减少核函数选择和窗宽参数对模型精度的影响,他们运用泰勒级数展开对参数部分进行简化,并将窗宽参数与周期项的解算统一考虑,从而将标准的半参数核估计模型变为半参数变系数模型。最后引入广义回归神经网络来对模型的拟合残差进行补偿,并通过贝叶斯优化算法来优化超参数。