2021-09-15
浏览次数:1980图1. ICDAR-2021-SVC冠军获奖证书
光学文字识别(OCR)领域的旗舰国际会议ICDAR 2021于9月5日在瑞士洛桑开幕。我院金连文教授指导的硕士研究生江佳佳、博士研究生赖松轩、硕士研究生朱业成组成的DLVC-Lab队伍,在本届大会举办的联机签名认证竞赛(ICDAR 2021 Competition on On-Line Signature Verification,简称ICDAR-2021-SVC)中,战胜来自德国、俄罗斯、西班牙、意大利、印度等国家的顶尖队伍,以较大优势再次荣获手写笔迹鉴别领域的国际竞赛冠军(图1)。
签名认证是一种重要的身份认证技术,它的认证对象是书写者的签名或其简写,因经常书写而具有较强的个人风格。与人脸、虹膜、指纹、声纹等特征相比,手写签名能够通过非侵入式、更加用户友好的方式进行采集,因此签名认证已被广泛应用于商务活动、银行办公、安全认证等场景。进入信息时代以来,随着电子设备的普及,联机手写签名认证技术得到了广泛的发展,获取媒介从最初办公场景的专用设备演变到当前的智能手机、电子平板等移动终端。在这些场景中,书写者可以灵活地选择手写笔输入或者手指输入。然而,联机手写签名具有样本数量少、在跨时间和跨设备的场景下呈现出较大的类内差异、容易遭受仿冒签名攻击的特点(如图2),给联机签名认证任务带来了很大的挑战。
图2. 一些联机手写签名的轨迹示意图(来自DeepSignDB数据集的u1010用户)
针对问题的难点,金连文教授团队提出了一个可端到端训练的深度软动态时间规整( Deep Soft-DTW,DSDTW)模型,赋予了经典的动态时间规整(Dynamic Time Warping,DTW)方法以表征学习的能力。首先,提取联机签名序列的速度及其一阶微分、加速度、压力、角度等信息的时间函数。其次,将各时间函数送入卷积循环神经网络CRNN进一步学习深度表征,为DTW提供有效的输入。接着,考虑到DTW对输入是不完全可微的,引入其平滑形式soft-DTW,并将签名对的soft-DTW距离融入到三元组损失函数中进行优化。由于soft-DTW是可微的,所以整个系统是可端到端训练的,实现了深度神经网络与经典动态时间规整算法的优雅融合。来自金连文教授团队的技术方案在来自俄罗斯、德国、西班牙、意大利、印度等参赛队伍提交的多个方法中脱颖而出,以较大优势获得了冠军(见表1、表2),在办公场景达到了3.33%的等错误率(领先第2名3.11%),在移动场景达到了7.41%的等错误率(领先第2名2.73%),在办公和移动的混合场景达到了6.04%的等错误率(领先第2名3.92%)。
表1. ICDAR-2021-SVC的最终评估结果
表2. ICDAR-2021-SVC的最终得分排名
注:上表中DLVC-Lab是华南理工大学视觉计算与深度学习实验室的英文缩写。
金连文教授团队本次参赛队伍(DLVC-Lab)成员组成如下:
? 江佳佳(硕士生)
? 赖松轩(博士生)
? 朱业成(硕士生)
? 金连文(指导老师)