桃子汉化组移植游戏大全

科研动态

桃子汉化组移植游戏大全:大数据智能识别与智能系统团队在ICDAR17 MLT竞赛中获得两项第一名

发布者:汪晓阳发布时间:2017-12-28浏览次数:460

在刚刚于日本结束的2017年ICDAR国际会议的MLT(多语言场景文字检测和文种分类)的全部三项比赛中,我院金连文教授带领的团队在场景文字检测,端到端场景文字检测及分类两项任务中取得第一名(后者以明显的优势)的好成绩,种分类的任务中以0.4%微弱差距位居第二名。

ICDAR MLTChallenge是目前为止含有语种最多而且数据量巨大的场景文本检测及语种分类的挑战赛,其中包含中文、日文、韩国、英语、法语、阿拉伯语、意大利语、德语和印第安语。ICDARMLT 比赛一共有三个任务,任务一是准确定位出各种各样的文字(平均每张图片有9.5个框)。任务二则是对预先切分好的文字图片进行语种分类。任务三是端到端地对场景文字进行检测和分类。ICDARMLT的图像采集自各种各样的场景,其中的文本的长度、字体、尺寸、颜色千变万化,同时还包含了许多真实场景的噪声包括光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,具有相当的挑战性。今年的比赛吸引了16来自不同国家地区的高校企业队伍参加。

MLT Challenge 文字检测语种分类任务 (fromhttp://rrc.cvc.uab.es/?ch=8&com=introduction)


ICDAR 2017的MLT的比赛中,针对场景文字检测问题,华南理工大学团队提出Deep Matching Prior Network Plus (DMPNet+) 的方法是一种基于深度学习的任意四边形场景文字检测方法,是金连文教授团队CVPR 2017论文方法DMPNet后续改进版本),这个方法以循序渐进地方式定位出文本的位置,再通过巧妙地后处理方式进一步提高检测的精度,并在MLT任务一中综合F指标达到了64.96%位列第一,其中在除了拉丁语和符号外的所有语种均比其他所有方法平均高出了10个百分点。在任务一中金连文教授带领的团队参赛人员分别还有刘禹良排名第1)、张胜、罗灿杰、李兆海、谢乐乐和孙增辉。


ICDAR2017 Robust Reading Challenge on Multi-lingual Scene Text Detection任务一冠军获奖证书

针对MLT任务三端到端检测及语种分类的问题,华南理工大学团队提出了随机切分和专为文本设计的滑窗算法,巧妙地结合了任务一中的文字检测框架,进行了分离式端到端的监督训练,最终在AP、召回率、精度和综合F指标分别比第二名分别出16.9%、19.1%、13.2%19.7%;上述四项指标均以较大的优势位列第一。任务三中金连文教授带领的团队参赛人员分别还有刘禹良(排名第1)、罗灿杰排名第2)、张胜、李兆海、谢乐乐和孙增辉。


ICDAR2017 Robust Reading Challenge on end-to-end Multi-lingual Scene Text Detection and Script Identification
任务三冠军获奖证书


此外为了进一步检验模型的泛化性能,华南理工团队还将MLT任务一训练得到的文字检测模型在不到2个小时内参加了其余三个比赛(ICDAR 2017COCO-Text, DeTEXT 和DOST)的文字检测挑战任务(并未使用这些数据集提供的训练数据,也未针对这些数据集进行任何训练及优化),均取得了令人鼓舞的成绩,其中在DOST的still imagelocalization 的挑战上还取得了第二名的好成绩,表明设计的模型有较好的泛化性能。


ICDAR2017 MLT 挑战赛参赛队员合照


桃子汉化组移植游戏大全最新网页版在线平台(2025已更新)