【阳光论坛】计算机与人工智能学院成功举办学校第849期阳光论坛

来源: 计算机与人工智能学院 作者:魏逸飞编辑人:罗园发稿时间:2025-09-22浏览次数:

2025年9月21日,计算机与人工智能学院邀请北京大学二级教授、博雅特聘教授彭宇新、电子科技大学研究员高莘,围绕多模态大模型、工具学习等前沿内容,以学术交流互动的形式展开深度探讨。北京大学王亦洲教授、武汉大学王骞教授、北京交通大学于剑教授作为特邀嘉宾出席。此次论坛由学院名誉院长严睿教授主持,学院院长胡新荣、党委书记晏伟及我院众多从事大模型研究的师生代表参会。

彭宇新教授在题为《基于多模态大模型的视觉内容理解与生成》的报告中系统阐述了多模态大模型在视觉内容理解与生成协同进化方面的突破性进展。他聚焦真实世界细粒度多模态特性对大模型的核心挑战,通过"细粒度多模态大模型"与"AIGC技术融合"的双轨研究路径,展示了团队在视觉内容理解与生成协同优化方面的创新成果。针对传统方法在内容真实性、逻辑合理性及语义一致性方面的技术瓶颈,团队提出了基于多模态对齐机制的生成模型架构,成功应用于TRECVID国际视频搜索评测并连续十年获得第一名。报告中展示的细粒度视觉理解与高质量内容生成的技术融合,为多媒体分析、计算机视觉等领域提供了重要的理论基础和实践指导。

高莘研究员以《面向实用化的大模型工具学习:细粒度偏好对齐与自动化集成框架》为主题,系统展示了其团队在大语言模型工具学习领域的创新突破。他从工具学习增强大模型实用性的核心需求切入,针对现有方法缺乏细粒度偏好对齐机制、依赖人工解析工具文档等关键痛点,创新性提出"TTPA框架"与"AutoTools框架"的双重解决方案。研究团队通过反向数据构建保证训练质量,采用token级别偏好采样技术捕获生成过程的微观差异,建立面向错误的评分机制实现精确偏好对齐。在自动化工具集成方面,团队开发的"AutoTools框架"使大语言模型能够自主将抽象工具文档转换为可执行函数,通过统一编程语言实现多工具灵活集成。广泛实验验证表明,该方法在复杂工具使用场景下性能提升达30个百分点,为构建实用化智能体提供了重要技术支撑。

本次讲坛现场学术氛围热烈,与会师生围绕人工智能前沿技术与产业应用展开深度交流。讲坛体现了浓厚的学术氛围和创新活力,推动了多模态智能、工具学习、视觉内容分析等相关研究领域的思想碰撞与交流合作,为学院人工智能学科建设和产学研协同发展注入了新的活力。