日前,云从科技的自然场景OCR(文字辨认)技术在ICDAR数据集上获得了多项最佳结果,特别对付东亚言语部门,该文本检测框架的体现尤为精彩,在多个子测试集上(包罗中文)都取得了第一。ICDAR是以后OCR技术范畴全球最具影响力的数据集,具有OCR范畴奥斯卡之称。 云从科技提出的Pixel-Anchor框架在两个具有应战性的自然场景文本检测测试集——ICDAR2015以及ICDAR2017 MLT中,别离在检测精确率和检测效率两个综合维度上取得了至今为止最好的后果(FMeasure,一种检出率和准确度的加权,详细见图Table 1-Table 3)。该沈阳网站设计框架在满足消费情况实时性要求的根底上取得了很高的检测精确率,该结果可进一步使用于计算机视觉、人工智能技术。同时,阿里巴巴、南京大学与南京理工大学、商汤科技、旷视科技也在榜单中表现出良好的结果,表白中国持续在国际上引领OCR范畴的研讨。 ![]() ![]() ![]() OCR(Optical Character Recognition)是指对输出图像停止阐发辨认处置惩罚,获取图像中文字信息的历程,具有遍及的使用场景。而自然场景中的OCR 技术不需求针对特殊场景停止定制,可以辨认恣意场景图片中的文字。 ![]() 和面对高质量文档图像的传统OCR比拟,自然场景OCR跳出了对输出图像的质量和场景约束,可以在更广泛的范畴中获取使用,惹起了学术界以及产业界的极大存眷。 但相较于传统OCR,自然场景OCR中的种种商品、背景或自然场景图片中的文本检测与辨认面临着庞大配景滋扰、文字的模糊与退步、不成预测的光照、字体的多样性、垂直文本、倾斜文本等众多应战。 计算机视觉根底技术 使用前景遍及 OCR是计算机视觉范畴的经典成绩,恒久以来,不断遭到学术界和产业界的连续存眷。在产业界,Google、Microsoft、Amazon等大型互联网公司,以及云从科技等人工智能创业公司,都在OCR技术上耕作多年。随着技术不停成熟,OCR也开端在互联网及其他行业逐渐上线运用,使用范畴也从文档辨认扩展到车牌辨认,图片告白过滤,场景了解,商品辨认,街景定位,票据辨认等遍及的范畴。 据悉,目前Pixel-Anchor框架已在云从科技的证件票据辨认零碎和图片告白过滤零碎中上线,每天处置惩罚图片近千万张,自动反应疑似违规图片精确率达96%以上;同时将证件处置惩罚和图文审核风险发明工夫从“小时”降低到“秒”级。数据显示,2018年云从科技累计处置惩罚25亿证件数据、屏蔽了400万条歹意推行,无效进步业务流程效率及污染营销情况。 除OCR以外,包罗人体姿势、跨镜追踪、车辆构造化、语音辨认百度排名等智能感知的焦点技术闭环曾经在云从科技外部取得建立,好比安防大数据零碎与智能商业运营平台使用“跨镜追踪(ReID)”技术,无需人脸也可以追踪目的。“逃犯克星”张学友的部门结果,就有“跨镜追踪”技术的到场。别的,云从科技也在浸入式大数据风控零碎、AI-IoT物联网使用等场景中引入了智能感知技术。 (责任编辑:admin) |