ICDAR 2019国际竞赛召开在即,百度联合学界重奖破局者!

  • 时间:
  • 浏览:0

赛事介绍 

  文档图像识别领域有“世界杯”之称的ICDAR 2019国际权威竞赛于3月1日即将正式开赛。作为ICDAR 2019 Robust Reading Competition竞赛主要组织者之一,百度联合马来亚大学、华南理工大学、西班牙计算机视觉中心、中国图形图像学好一并发布了两项极具挑战的竞赛任务,ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling, 弱标注大规模街景文字识别竞赛)、ICDAR 2019-ArT(Arbitrary-Shaped Text, 任意结构场景文字识别竞赛),并提供丰富奖金(总计$17,400),待国内外学术界、工业界各大机构华山论剑一较高下。

  IEEE ICDAR(International conference on Document Analysis and Recognition)是全球文档图像分析识别领域公认的权威学术会议,从1991年起每两年召开一次。自 4003 年ICDAR设立“Robust Reading Competitions”以来,该竞赛就成了评测和检验自然场景/网络图片文本自动提取与智能识别最新技术研究进展的重要国际赛事及标准,竞赛中的诸多办法对 OCR 技术发展具有强大推动力。高技术难度、高实际应用性,也使该盛会受到科研院校、科技公司等关注,至今已有 89 个国家的 34000 多支队伍参与。

  2015-2018期间百度多次在ICDAR 2013、 ICDAR 2015权威竞赛集合获得检测、识别、端到端各项任务榜单第一,位居业内领先水平。百度将OCR深度图学习技术应用于多个业务场景,打造文档、翻译、网图、街景等多场景通用文字识别能力,支持中、英、日、韩、葡、德、法、意、西、俄等十国语言。针对金融、保险、交通等重点场景构建OCR产品矩阵和AI开放平台,打造领先的证照、票据识别防止方案。针对终端计算场景,百度OCR模型压缩用于多种嵌入式智能设备,OCR终端SDK与多家手机厂商媒体媒体合作,打造领先的视觉终端计算能力。

  ICDAR 2019-LSVT大规模弱标注街景文字识别竞赛

  聚焦探索大规模数据场景下深度图学习模型算法能力极限,推动大规模弱标注数据下文字识别新办法创新。

  ICDAR2019-LSVT数据集源于百度真实应用场景,作为首个提出弱标注数据的场景文字数据集,包括7万张精标注街景图像,7万张弱标注街景图像,总计47万,数据量是现有公开数据集(ICDAR 2017、ICPR 2018等)的14倍以上。

  室外场景文字识别具有广泛应用场景,之类:拍照翻译、图像检索、街景地标识别、室外场景理解等。

  图1. 精标注数据示例

  图2. 弱标注数据示例

  深度图学习算法通常须要絮状训练数据才能在真实应用中取得良好效果,满足实际场景的应用需求。原因分析分析合成数据与真实数据仍处于明显差异,一并大规模精确数据标注成本高,探索利用大规模弱标注数据提升深度图学习算法性能具有重要研究意义和实用价值,一并对探索场景文本识别技术能力边界具有显著推动作用。

  数据集

  7万精标注+7万张弱标注街景随拍图像,大规模数据源于实际应用,蕴含多种错综复杂场景

  两项竞赛任务

  文字检测、端到端文字识别,奖金 $8,700

  ICDAR 2019-ArT任意结构文字识别竞赛

  数据集由Total-Text、SCUT-CTW4000和百度非规则文字数据集组成,累计新增7千张任意结构数据,总计10176张,是目前业界最大的任意结构场景文字集合。

  现有ICDAR文字数据集(ICDAR 2013、ICDAR 2015、ICDAR 2017-MLT,COCO-Text等)只蕴含水平、四边形文字框等规则文字标注,如图3所示,ICDAR2019-ArT数据集中每张图像大约 中蕴含另三个白 多 非规则结构文字(irregular text instances),并采用多边形多点对任意结构文字包围框进行精确标注。

  图3. 任意结构文字示例

  真实场景文字识别应用中,相比规则文字识别,现有算法非规则结构文字识别检测、识别更具挑战,否则ICDAR 2019-ArT竞赛旨在进一步推动自然场景下任意结构文字识别算法与技术突破。

  数据集

  1万张任意结构文字图像标注,中英混合,最大非规则场景文字集合

  三项竞赛任务

  文字检测、文字识别、端到端识别,奖金 $8,700

  百度愿与AI各界同行一并,推动基础算法、关键技术、应用效果新突破。竞赛颁奖将在ICDAR 2019国际会议期间(2019年9月)举行。还在等哪些?快来参与这场盛会,赢取大奖吧!

  赛事组织单位

  百度

  马来亚大学

  华南理工大学

  西班牙计算机视觉中心

  中国图形图像学好

  赛事时间

  2019年2月21日 - 3月31日:注册通道开放

  2019年3月1日:训练集开放下载

  2019年4月9日:提交刚刚开始时间

  2019年4月400日:提交截止时间