论文信息
原文:IDEAW: Robust Neural Audio Watermarking with Dual-Embedding
作者:Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
录用:EMNLP 2024, Miami, USA
模型构架
概述
基于神经网络的数字音频水印(称为神经音频水印,Neural audio watermarking)的优势在于其鲁棒性不需要依赖于专家经验知识,而是在训练过程中通过模拟从受攻击的音频中提取水印的过程来获得鲁棒性。定位开销是神经音频水印面临的一项挑战,因为在定位过程中会重复地迭代水印提取过程,这涉及到神经网络的前向传播导致的时间开销,IDEAW设计了一种垂直分离定位码和水印消息的双层嵌入水印模型,将定位码与消息分别进行嵌入,更短的定位码可以使用较浅层的神经网络保证不可感知性和提取完整性,实验证明使用浅层网络单独提取定位码䏻有效减少定位过程的时间开销,尤其是在需要更深层的网络保证大承载容量的情况下。此外,IDEAW还优化了作为基础模型的可逆网络在加入攻击模拟后存在的不对称性的问题。
引用
如果IDEAW对您的研究有帮助,或用作baseline,欢迎引用:
1 | @inproceedings{li2024ideaw, |