航空气象地图的分层化OCR系统及其若干关键技术的研究

日期:2016.12.22 点击数:27

【类型】学位论文

【作者】田晓光 

【关键词】 OCR系统 图像分割 图文分离 线条重组识别 字符识别

【摘要】OCR(Optical Character Recognition光学字符识别)系统技术是一种专门针对电子文本信息化处理的系统。随着电子文本的日新月异的发展,目前国内外针对常规性对象(26个大小写字母和10个数字)的主流OCR系统已经显现出无法满足现实需求的情况,尤其遇到像航空气象地图这样的复杂背景下的大信息量(其不仅包含线条,而且包含着字符和特殊气象符号)电子文本而言可以说是束手无策。 本文依托企业项目“航空气象地图分层化OCR技术的研究”,在分析国内外的相关理论及关键技术的基础上,以架构航空气象地图的分层化 OCR系统结构为目标,而且对其中的前景区域和背景区域的图像分割算法、图文分离算法、线条的重组识别算法、字符特征的提取和识别等一系列相关的关键技术和迫切需要解决的效果问题展开了深入而细致的相应研究和讨论,其主要的研究内容及成果如下: (1). 提出了一种有效的图像前景区域和背景区域的分割模型(二维直方图熵值斜分算法),此外又根据K-L距离理论,提出了一种可避免繁琐计算,更能全面直观反映指标的仿K-L距离评判函数。该种分割方法建立在局部区域信息统计和全局区域信息统计的整体之上,可以有效的避免了在复杂背景下常规彩色分割方法失效的情况发生,而且又克服了常规的灰度分割法中的双刃剑问题:如果仅仅采用局部分割法容易造成全局信息上的分割错误和如果仅仅采用全局分割法容易造成局部信息上缺损和不完善。 (2). 根据形态学的相关理论推导出了一个有效的图文分离算法,而且给出了形态学方法中的关键部分:结构元素的主要参数。对比目前常用的图文分离算法,该方法具有实现简单,速度快、分离之后的结果完整性好等优点。 (3). 提出了一种专门针对线条提取重组、识别的快速算法,可以填补目前暂无有效的线条重组、识别算法的空白。该算法主要依据线条与线条之间的数学关系表达式理论和粒子群快速算法(PSO)理论下完成,它在具有了粒子群算法的较快速度的优点之外,还具有较高的重组准确度,从而可以为间断的实线进行修复。此外,根据线条类型之间的差异(虚线符合规律分布、间断直线不符合规律分布),提出了利用能量函数来区分其之间的可靠识别方法。 (4). 提出了另外一种改进型复数矩的数学表达式,并在该式的基础上进行了矩不变量的推导和矩不变量阶数范围的证明。该表达式主要根据目前最为先进的中心矩方法、复数矩方法上整合得到,不仅具有中心矩的位置不变性优点,也具有了复数矩的多坐标系转化能力。此外,也根据相关的定理和实验证明出了对于不变量特征的选取不能仅仅局限在独立与非独立范围上,应该转化为在全局上选取最优。 (5). 提出了一种基于多层结构的Winner-Update标准互相关矩不变量的特征匹配方法。该方法主要依据Jensen’s 和Cauchy-Schwarz不等式理论,在Winner-Update方法和深度优先搜索的DGA图的辅助下,能够有效的解决标准互相关函数的计算量繁琐问题以及上小节提到的特征不变量的优良选取问题。此外,该方法运用了多学科的知识交叉,利用了数据库技术中的 Hash表来有效的提高最终结果的搜索和信息存储优化等问题。 (6). 依据以上提出的单个字符识别算法和仿生学滴水分割算法的相关理论,提出了针对粘连字符的分割识别算法。其中重点针对仿生学滴水算法中存在的问题,利用相关的交叉学科理论(经典的牛顿物理运动学理论)进行了相应改进和完善,从而使仿生学滴水算法的效果得到了大幅度的提高,可以在花费较短的时间内保证目前所归纳的三种粘连字符(线性粘连、非线性粘连和粘连重合)的分割准确性和识别率。 应用了以上理论及关键技术,成功设计和完成了针对航空气象地图的分层化OCR系统处理平台。对比目前常规的系统测试表明:该系统具有很强的信息分析和处理能力,不仅对于系统中的图文分离算法和图像分割算法之后的结果能够保证了信息的完整性和准确性,而且最终也能够较好的完成字符、线条的重组识别(数据识别率高达98%以上),完全达到实际工作的要求,很好地达到了本文研究的目的。

【学位名称】硕士

【学位授予单位】电子科技大学

【学位授予年度】2016

【导师姓名】侯晓荣

【读秀链接】读秀链接

3 0
Rss订阅