云从科技研究院自身算法工程师李源介绍mt4教程视频光学字符识别(Optical Character Recognition,以下简称OCR)是指认识图像从而获取文字讯息的经过,不少智好手机中的咭片扫描软件就有这一性能。2018年11月20日,OCR界限的首要目标——邦际文档认识与识别大会(ICDAR)测试集被再次改革,中邦高校及企业承办ICDAR2015排行榜前五,按次为云从科技(Pixel-Anchor)、南京大学与南京理工大学(PSENet)、旷视科技(Mask Text)、商汤科技(FOTS)、阿里巴巴(IncepText)。
鲁棒文本阅读竞赛的测试数据集平昔正在网上公然,能够随时提交结果,是自然场景文本检测行业中考验算法的测试数据集。ICDAR2015和ICDAR2017 MLT即是此中两个测试子集。
彭湃消息采访了目前位于ICDAR2015榜单第一名的云从科技。云从科技酌量院自己算法工程师李源先容,CDAR2015和ICDAR2017 MLT是自然场景文本检测界限的巨擘数据集,“基础上一共著作城市正在上面检测”。
CDAR2015榜单(2018年11月20日)。F值代外精度和检出率的调解均匀数,也是排名的依据,F值越大,检测结果越优。
他为记者解读了这份榜单,精度(Precision)代外检测结果中精确文本的比例;检出率(recall)则反应被检出文本与图片文本总数的比例,可以外现是否漏检了文本。为了检测算法的成效,必要归纳研讨精度和检出率,而F值正好代外精度和检出率的调解均匀数,也是排名的依据。
必要留意的是,这里提到的自然场景文本检测并不等同于文本识别,前者不具备识别文字的性能,而是指正在图片中检测出文本。
李源显露,2018年11月20日,云从科技正在预印本网站arXiv上楬橥了最新论文结果,该论文提出了用于自然场景文本检测的Pixel-Anchor框架。论文楬橥之前,他们正在邦际文档认识与识别大会颁发的ICDAR2015和ICDAR2017 MLT数据集上检测了Pixel-Anchor算法,并改革了ICDAR2015的最佳结果。
据悉,ICDAR2015是纯英文文本检测数据集,ICDAR2017 MLT则包罗了拉丁文、英文、中文、韩文、日文、阿拉伯文等9种文字。云从的Pixel-Anchor算法正在ICDAR2017 MLT归纳榜单中排名第四,排名前三的三家海外机构没有提交公然论文。
ICDAR2017 MLT归纳榜单(2018年11月20日)(带*号显露没有楬橥公然论文)
除去没有楬橥公然论文的几家机构,ICDAR2017 MLT数据集前五名及框架名称分散是云从科技(Pixel-Anchor)、阿里巴巴(ATL-cangjie)、商汤科技(FOTS)、旷视科技(EAST++)、南京大学(PSENet_NJU)。
ICDAR2017 MLT的中文榜单中,云从科技排名第一,商汤科技位居第二。
但相较于古板的文本检测OCR,自然场景中的百般商品、配景或自然场景图片中的文本检测与识别面对着纷乱布景滋扰、文字的隐约与退化、不成预测的光照、字体的众样性、笔直文本、倾斜文本等挑拨。与针对高质地文档图像的古板OCR比拟,自然场景文本检测能正在更广泛的界限中利用,比方照片认识、车牌识别,图片广告过滤,场景融会,商品识别,街景定位,单子识别等。
转载请注明出处。