腾讯优图29篇论文当选，含人脸安全、图画分割

未知 2022-07-13 18:56

近日，欧洲核算机视觉国际会议ECCV2022（European Conference on Computer Vision）发布了论文选用结果。本届ECCV2022论文总投稿数超越8170篇，其间1629篇论文中选，选用率缺乏20%。

ECCV（European Conference on Computer Vision)是国际顶尖的核算机视觉会议之一，每两年举行一次。跟着人工智能的开展，核算机视觉的研讨深化和应用迅速开展，每次ECCV的举行都会招引很多的论文投稿，而本年ECCV 2022的投稿量更是接近ECCV 2020的两倍，创下历史新高。本年，腾讯优图试验室共有29篇论文当选，内容包括人脸安全、图画分割、方针检测等多个研讨方向，展现了腾讯在核算机视觉范畴的科研及立异实力。

以下为腾讯优图试验室部分当选论文概览：

依据差分隐私结构的频域下人脸辨认隐私维护算法Privacy-Preserving Face Recognition with Learnable Privacy Budget in Frequency Domain

脸辨认技能因其极高的准确性在日常生活中被广泛运用，但与此一起，用户对于个人人脸图画被滥用的忧虑亦与日俱增。现在维护隐私的人脸辨认办法往往伴跟着许多副作用，如推理时刻的大幅添加和辨认精度的明显下降。本文提出了一种在频域下运用差分隐私的人脸辨认隐私维护算法。该办法首要将原始图画转换为频域特征，并去除其间的直流部分以消除原始图画中绝大部分的可视化信息。然后在差分隐私结构内依据后端人脸辨认网络的丢失学习隐私预算分配模块，并将相应的噪声添加到频域特征中。由于该办法依据差分隐私结构，隐私性的确保得到了理论支撑。而且可学习的隐私预算分配模块的加入使得噪声的添加尽可能少的影响该办法的辨认精度。依据很多的试验，该办法在经典的人脸辨认测试集上获得了极好的体现并在对立进犯下具有很强的抗进犯能力。

具有范畴自习惯能力的行人查找算法Domain Adaptive Person Search

行人查找技能旨在实现端到端联合行人检测和行人重辨认使命。曾经的作业在全监督和弱监督的环境下取得了重大进展。但是，这些办法疏忽了行人查找模型的跨范畴泛化能力。咱们进一步提出范畴自习惯行人查找办法DAPS，旨在将模型从已知身份和检测框标示的源范畴推广到没有任何标示的方针范畴。在这种新设置下呈现了两个首要应战：一个是怎么一起处理检测和行人重辨认使命的范畴错位问题，另一个是怎么在方针域上没有可靠检测结果的情况下练习行人重辨认子使命。为了应对这些应战，咱们提出了一个具有专用规划的强大基线结构。 1）咱们规划了一个范畴对齐模块，包括图画级和使命敏感的实例级对齐，以最小化跨范畴差异。 2）咱们经过动态聚类策略充分利用未标记数据，并运用伪鸿沟框来支持方针域上的检测和行人重辨认联合练习。经过上述规划，咱们的结构在PRW和CUHK-SYSU数据集间的跨范畴搬迁功能，大大超越了未经跨范畴自习惯直接搬迁的模型。咱们的无监督自习惯模型的功能乃至能够超越一些全监督和仅知检测框的弱监督的办法。

大规模掌纹辨认练习的“免费午餐”Geometric Synthesis: A Free lunch for Large-scale Palmprint Recognition Model Pretraining

掌纹是一种稳定可靠的生物特征，而且具有很强的隐私特点。在深度学习年代，掌纹辨认技能的开展被练习数据缺乏束缚。在本文中，经过对模型呼应的调查咱们确定掌纹线是深度学习掌纹辨认中的要害信息，能够经过人造掌纹线进行练习。详细来说，咱们引入了一个直观的几许模型，该模型运用参数化的贝塞尔曲线标明掌纹线。经过随机抽样贝塞尔参数，咱们能够组成很多不同身份的练习样本，然后运用预练习掌纹辨认模型。试验结果标明这种运用人造数据预练习的模型有非常强的泛化性，能够高效率地搬迁到实在数据集并显著提高掌纹辨认的功能指标。例如在开集设置下，咱们的办法在FAR=10^-6时TPR相对Arcface提高10%以上。在闭集条件下咱们的办法也能削减EER一个数量级。

依据生成式域习惯的人脸活体检测办法Generative Domain Adaptation for Face Anti-Spoofing

依据域习惯 (DA) 的人脸活体检测 (FAS) 办法因其在方针场景中的搬迁功能良好而遭到越来越多的重视。大多数现有的域习惯人脸活体检测办法经过对齐语义级别的高层特征散布将源域模型拟合到方针数据。但是，由于方针域上标签缺失导致的监督缺乏以及对于低层特征对齐的忽视束缚了现有办法在人脸活体检测上的功能。为了处理这个问题，本文从一个新的视点来处理域习惯人脸活体检测问题，即让方针数据拟合到源域模型，经过图画转换将方针数据风格化为源域风格，并进一步将风格化的数据输入源域的活体检测模型进行判别。详细而言，本文提出了生成式域习惯（GDA）结构，并结合域间特征散布一致性束缚和双重语义一致性束缚来确保生成图画风格和内容与方针的一致性；此外，咱们还提出域内频谱混合模块来进一步扩展方针域数据散布并提高泛化性。多个活体检测数据集上的试验和可视化结果标明，比起当时的领先办法，咱们办法具有更好的搬迁性。

依据多层级比照学习的视频编辑检测算法Hierarchical Contrastive Inconsistency Learning for Deepfake Video Detection

近年来，跟着 Deepfake 技能的快速开展，生成传神假造人脸的能力引发了公众的忧虑。与实在人脸视频比照，假造视频中人脸面部运动的时序不一致性是辨认 Deepfake 的有用头绪，但是现有的办法往往只施加二分类监督来建模这种不一致性。在本文中，咱们提出了一种新型多层级比照不一致性学习结构（HCIL）。详细而言, HCIL 首要对视频进行多片段采样, 并一起在局部片段和全局视频层级上构建比照表征学习，然后能够捕获真假视频之间更实质的时序不一致差异。此外咱们还引入了用于片段内不一致性挖掘的区域自习惯模块和用于跨片段信息融合的片段间融合模块，来进一步促进特征学习。很多试验标明, HCIL 模型的功能在多个 Deepfake 视频数据集上优于当时的办法。一起, 跨数据集泛化性试验和可视化也证明了该办法的有用性。

依据信息注意力驱动的图画编辑检测算法 An Information Theoretic Approach forAttention-Driven Face Forgery Detection

在人脸假造检测使命中，从前依据CNN的启发式办法简单疏忽纤细的篡改痕迹。本文指出这些纤细伪影往往富含高信息量，然后将自信息作为一种衡量引入到假造脸检测使命中，并结合注意力机制来增强网络对高信息量假造区域的特征提取。一起本文还提出了一种跨层间的自信息聚合机制来缓解卷积神经网络下采样操作对纤细假造区域的擦除问题，进一步加强假造区域特征的保存和提取。详细而言，咱们首要对输入特征图核算自信息，用于开掘一切潜在的高频假造信息。随后结合自信息与双流注意力机制，分别在通道维度和空间维度核算注意力值来进一步增强潜在的高信息量区域，让网络挖掘出更多易被疏忽的假造信息。最终，当时层的自信息特征图将会跨层连接到下一个层注意力模块，更好地保存浅层纤细假造信息。本文规划的即插即用的注意力模块，能够应用到多种人脸假造检测结构中。多个假造人脸检测数据集上的试验标明咱们的办法在添加少数参数的情况下，能够进一步提高网络的检测功能和泛化性。

依据原型比照的语义分割搬迁学习算法 Prototypical Contrast Adaptation for Domain Adaptive Semantic Segmentation

无监督搬迁学习旨在将源域练习好的模型直接搬迁在无标签的方针域，在实践场景如工业质检场景下有着重要作用，由于新场景下缺点呈现的概率往往很低，难以搜集缺点数据。以往的办法往往只利用特征的类间散布进行特征对齐，疏忽了类间的关系建模，这就造成方针域下对齐的特征判别能力缺乏。因此，本文提出经过原型比照的方式一起建模类内以及类间散布，咱们的办法Prototypical Contrast Adaptation, 简称ProCA。详细地，ProCA经过对每一类保持一个原型表达，在特征对齐时，考虑同类的原型作为正样本，不同类的原型作为负样本然后实现类中心的散布对齐。比较现在已有的作业，ProCA在GTA5-Cityscapes以及SYNTHINA-Cityscapes上取得了更先进的结果。

标签