当前位置：坚果智云扫描 > 常见问题 > 正文

什么是OCR文字识别技术？

2021-03-01 分类：常见问题阅读(1758)

OCR （Optical Character Recognition，光学字符识别）是指电子设备检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。一个OCR识别系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，当然也可节省因键盘输入的人力与时间。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题。

衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。因为其牵扯的因素太多了，书写者的习惯或文件印刷品质、扫描仪的扫描品质、识别的方法、学习及测试的样本……等等，多少都会影响其正确率，也因此， OCR的产品除了需有一个强有力的识别核心外，产品的操作使用方便性、所提供的除错功能及方法，亦是决定产品好坏的重要因素。

这个技术的门槛相当的高，目前能做中文OCR识别的公司并不多，所以那些独立开发者开发的OCR软件，一般都是借用大公司的API接口。大多数的OCR识别软件要么识别准确率较低，或者部分符号识别有点问题，要么识别完之后只能看到识别结果，看不到原图，不方便对比查错。

所以这种时候认准大公司、老牌公司一般没错。科技针对国内市场发布了更具本地化的PDF专家产品，它不仅能将中文OCR识别做的极为出色，同时还能对多语种进行OCR文字识别，包括日语、德语、西班牙语、葡萄牙语、意大利语等基本所有的主流语种。这是其他大部分OCR识别软件难以实现的一个技术。同时，PDF专家还可以进行区域OCR识别，避免了繁琐的全文识别，减少了算力的浪费，大大提升了使用的便捷程度和舒适度。

未经允许不得转载：坚果智云扫描 » 什么是OCR文字识别技术？

标签：OCR OCR身份证识别图片识别扫描扫描文件文字识别

相关推荐

免费扫描软件无广告无水印

坚果云扫描下载坚果云扫描介绍