因为OCR-SDK开发包只有行业内专业的人才知道这个,所以我这里给大家普及几个知识点!
知识点 1:是否有开源的开发包?
好多做图像OCR识别的公司技术人员希望公司自己能有一套OCR识别技术,于是首先想到的是寻找免费开源的开发包源码来进行二次调用、引用、开发、优化、完善,很多OCR技术小白找到了凑合能用tesseract,做了下简单的集成开发,就沾沾自喜的认为自己有多牛逼的ocr技术了,还去忽悠公司领导说识别率非常高,非常好用;其实但凡是负责人的领导自己正经一测试,就会很快发现问题!
我们来发掘一下tesseract的历史,tesseract是过去惠普开发的,但HP技术毕竟能力有限,无法给客户很好的提供服务,于是就把tesseract开源了,以搅乱市场,后来被google收购。
也有很多其他商用的OCR厂商,是技术上有优势的,是要靠OCR开发包盈利的,不会开源,比如、汉ocr。OCR是一个古老的技术,今天这个开源的OCR开发包当年并不是做的最好的,相反是做的最差的。没有商业化的模式和利益,技术怎么可能向前不断发展,技术发展是要靠人才的,而人才是非常昂贵的。
知识点2:OCR-SDK开发包识别算法究竟有多难?
之前接触过一些爱吹牛B的ocr技术小白,非常高逼格、装逼、装淡定、装高手、装专家的叙述 : OCR开发包很早就开源了,现在谁还花钱买啊(参照知识1),当然也有一些研究生学生毕业不久,比较谦虚的跟我聊天,说上大学的时候做过ocr方面的论文和开发项目,大概了解用过,开源的确实识别率无法达到应用层级,这些学生反而很诚恳;
客观来讲,以文通科技的开发包技术为例,他们的技术来源于清华大学电子图文工程系人工智能实验室;为 了实现产业转化并能提供持续升级、优化、完善、开发、维护的经济成本,已经是国内最顶尖的OCR算法开发的技术人员还是在不断的学习、研究、讨论各种场合下的、各种类型的、各种颜色的图片文字OCR识别提取技术!包括、长微博图片OCR文字识别、视频文字OCR识别等,都是国内外独一无二的新技术;百度号称要进军深度学习领域,还招聘了大量的高学历人才来研究ocr技术,来补缺深度学习技术的短处,现在还远远没有赶上文通ocr的SDK开发包的技术。
知识点3:OCR-SDK开发包支持的语种可以随意添加?
中国人大部分还是用中文简体的开发包,很多人不知道有专业公司开发维护的ocr-sdk开发包技术,是支持简繁体互换识别、中英混排识别、日文、韩文、英德法俄意大利文、藏文、维文识别的;比如文通开发包就支持上述语种的识别支持,汉只有中文和英文识别,中英混排我没用过,大家可以抽空下载试试看!
呵呵,毕竟术业有专攻,社会及技术的不断发展也是靠细致化的社会分工来不断推进的。你需要字符识别技术,就还是根据自身情况坐下权衡取舍,免费开源or商业版本?