足球世界杯视频

AI测评 | 十二款开源OCR开箱测评,文字识别哪家强

为了全面评测OCR工具各种场景下的识别和解析能力,本次测评收集整理了多种类型文字识别的图片数据,包括印刷中英文、自然场景、手写文字和验证码等方面数据集,具体文字识别数据集分类如下:

文字识别能力主要评测OCR工具对文字的检测和识别能力,包括支持识别的字符集规模(生僻字),字体形变(字体、艺术字),图像旋转、形变、干扰信息、明暗、模糊等外部因素影响。

备注:文字识别能力只考察是否正确识别出字符,不考察文字结构信息(即输出结果的文字顺序)。其中,中文统计粒度为字,英文为单词(区分大小写),中英文标点符号相互区别。

字符识别准确率(Precision):正确识别的字符数/识别输出总字符数

字符识别召回率(Recall):正确识别的字符数/验证集总字符数

字符识别综合评分(F-Score):2*Precision*Recall/(Precision+Recal)

平均响应时间:基准样本识别总时间/样本数量。

测评结果

(1)印刷中文的综合测评结果为:

(2)印刷英文的综合测评结果为:

(3)变形字体的艺术字测评结果为:

(4)自然场景的街景图片测评结果为:

(5)手写中文的综合测评结果为:

【关注公众号在后台回复“OCR”即可下载完整版报告。】

测评总结

印刷中文识别准确度测试中,综合前三分别是RapidOCR、RagFlow和Surya。

在印刷英文识别准确度测试环节,综合前三分别是Surya、Unstructured和读光OCR,还是国外开源软件领先。

在各种变形字体(艺术字、验证码等非标准字体)场景下,由于本次测评仅采用各OCR工具自身提供的预训练模型进行测试,识别准确度均较低,如需提高变形字体的准确率需要针对变形字体进行专项训练。

在复杂多行文字的街景场景中,前三名分别是RagFlow、RapidOCR和PaddleOCR,它们的综合评分相当接近,均略高于70%。

在手写中文识别场景下,综合前三分别是RapidOCR、ChineseOCR和RagFlow。

在响应时间方面,表现优异的有OcrLiteOnnx(0.01秒级)、RagFlow(0.1秒级),响应非常快。另外,ChineseOCR、EasyOCR和RapidOCR表现也不错,平均时间小于1秒。