学院内网

学院资讯

当前您的位置: 首页 > 学院资讯 > 正文

人工智能与安全团队在国际顶级期刊TDSC发表研究成果

发布日期:2025-08-26

近日,我院“人工智能与安全团队”在大模型安全方面又取得新的研究进展,相关成果《A Multimodal Adversarial Attack Method via Frequency Domain Enhancement and Fine-Grained Cross-Modal Guidance》在线发表于《IEEE Transactions on Dependable and Secure Computing 》(TDSC)。TDSC是网络与信息安全领域的顶级期刊,也是中国人工智能学会(CAAI)、中国计算机学会(CCF)共同推荐的A类期刊。我院钱亚冠教授为第一作者,鲍琦琦博士和哈尔滨工业大学顾钊铨教授为通讯作者。该项工作得到了国家重点研发计划项目、国家自然科学基金面上项目、浙江省自然科学基金重点项目等的资助。

视觉-语言预训练(Vision-language pretraining, VLP)模型在图文理解任务中展现出卓越性能,但仍极易受到可迁移对抗性攻击的影响。尽管基于集成的引导式攻击通过增加图文对的多样性提升了对抗可迁移性,但其主要依赖空间域数据增强,这可能导致模型过度拟合图像细节,进而限制攻击的泛化能力。为解决这一局限性,论文提出一种基于频域调整的对抗性攻击方法:通过修改输入图像的特定频率成分,减少细节干扰并提高对抗样本的稳定性。此外,研究还引入细粒度特征提取技术,用于优化图文对齐,进一步提升跨模态攻击的可迁移性。实验结果表明,在 Flickr30K 和 MSCOCO 数据集上,针对融合模型(fusion models)与对齐模型(alignment models)这两大 VLP 架构,以及多个任务的测试中,所提方法均实现了更优异的攻击可迁移性与泛化性能。


地址:浙江省杭州市留和路318号

邮编:310023

电话:0571-85076081

邮箱:aiie@ zust .edu.cn

版权所有:浙江科技大学人工智能与信息工程学院