什么是文字识别-坚果智云扫描

文字识别（Optical Character Recognition，简称OCR）是指对图像文件的打印字符进行检测识别，将图像中的文字转换成可编辑的文本格式，以JSON格式返回识别结果。

OCR以开放API（Application Programming Interface，应用程序编程接口）的方式提供给用户，用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字，帮助用户自动采集关键数据，打造智能化业务系统，提升业务效率，API获取详情请参考《API参考》。

OCR还提供多种编程语言的SDK供您使用，SDK使用方法请参考《SDK参考》

OCR能力

通用类OCR

通用类OCR（General OCR），支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别，自适应分析各种版面和表格，快速实现各种文档电子化。

证件类OCR

证件类OCR（Card OCR），支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。

票据类OCR

票据类OCR（Receipt OCR），支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。

行业类OCR

行业类OCR（Domain OCR），支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别，助力行业自动化效率提升。

定制模板OCR

定制模板OCR（Custom OCR），支持用户自定义识别模板，指定需要识别的关键字段，实现用户特定格式图片的自动识别和结构化提取。

什么是文字识别