自对抗训练是一种模型通过策略性地剥夺自身最依赖的信息,迫使自己学习其他预测方式的技术。例如,若模型检测到自己主要依靠猫的耳朵来识别猫,它会关闭输入中作用于相关神经元的部分信息,从而强制自己同时学习其他识别猫的特征(如爪子和尾巴)。