OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。
衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。因为其牵扯的因素太多了,书写者的习惯或文件印刷品质、扫描仪的扫描品质、识别的方法、学习及测试的样本……等等,多少都会影响其正确率,也因此, OCR的产品除了需有一个强有力的识别核心外,产品的操作使用方便性、所提供的除错功能及方法,亦是决定产品好坏的重要因素。
这个技术的门槛相当的高,目前能做中文OCR识别的公司并不多,所以那些独立开发者开发的OCR软件,一般都是借用大公司的API接口。大多数的OCR识别软件要么识别准确率较低,或者部分符号识别有点问题,要么识别完之后只能看到识别结果,看不到原图,不方便对比查错。
所以这种时候认准大公司、老牌公司一般没错。科技针对国内市场发布了更具本地化的PDF专家产品,它不仅能将中文OCR识别做的极为出色,同时还能对多语种进行OCR文字识别,包括日语、德语、西班牙语、葡萄牙语、意大利语等基本所有的主流语种。这是其他大部分OCR识别软件难以实现的一个技术。同时,PDF专家还可以进行区域OCR识别,避免了繁琐的全文识别,减少了算力的浪费,大大提升了使用的便捷程度和舒适度。