视觉感知与智能计算团队科研成果在人工智能一区TOP期刊发表
近日,信息科学与工程学院视觉感知与智能计算团队最新科研成果“LSTT: Long short-term feature enhancement transformer for video small object detection”被人工智能权威期刊《Expert Systems With Applications》(ESWA)录用。
ESWA是由Elsevier出版的国际权威期刊,专注于人工智能、专家系统及其跨学科应用领域的研究。该期刊为中科院SCI一区TOP期刊,2025年影响因子7.5。杨威老师为论文通讯作者。
传统视频小目标检测方法对长期和短期时间信息多采用统一处理策略,却忽略了不同帧之间蕴含的差异线索,而这些线索正是提升小目标检测精度的关键。针对该问题,论文提出的LSTT网络创新性地采用端到端多帧融合架构,可同步提取长期帧的全局场景上下文信息与短期帧的细粒度外观及运动线索,实现了长短期时间特征的精准融合与高效利用。通过在两大数据集上的大量实验验证,LSTT能显著提升目标检测精度。
该研究成果为视频小目标检测领域提供了全新的技术路径,在智慧城市、安防监控、自动驾驶等依赖精准目标识别场景中具有重要价值。
教工通讯员 王颖
编辑 张璐