免费扫描软件
无广告、无水印

Halcon中使用OCR时字符的分割以及字符粘连的处理方法

/u013698770/article/details/53027403

字符的分割是指在原图中将字符分割为单个的字符区域。这样,这些单个的字符才能被当作字符样本来训练分类器。因此,样本字符分割的好坏很大程度上影响mlp分类器的分类效果。

那么,怎样才能判断自己的字符分割是好的呢?标准是:字符不要有因干扰导致的洞孔。建议的字符分割步骤如下:

(1)使用小阈值来分割字符,使字符经可能的饱满。此时第一个分割出来的字符称为原始字符区域 threshold (ImageReduced, RawSegmentation, 83, 255)(2)使用填充算子,将整个字符区域填充,此时的字符称成胖字符fill_up (RawSegmentation, RegionFillUp)(3)使用开运算滤除杂波的干扰opening_circle (RegionFillUp,RemovedNoise, 2.5)(4)根据形状特征选取胖字符区域select_shape(RemovedNoise : ConnectedPatterns : ‘area’, and, 300, 3000 : )(5)胖字符区域与原始字符区域相交得到最后的字符区域intersection (ConnectedPatterns, RawSegmentation, NumberCandidates)(6)最后,调用connection算子得到每一个字符的联通区域 connection ( NumberCandidates : ConnectedNumberCandidates : : ) 123456789101112

注意,如过字符之间存在粘连导致connection难以分割,则需要调用开运算算子来消除粘连。

该特殊矩形开运算算子的特别之处在于消除粘连区域,同时保留原始字符区域opening_rectangle1 (Solid, Cut, 1, 7)

未经允许不得转载:坚果智云扫描 » Halcon中使用OCR时字符的分割以及字符粘连的处理方法
分享到: 更多 (0)

免费扫描软件 无广告 无水印

坚果云扫描下载坚果云扫描介绍