一项调查在孤立的字符识别的过程

Karanbir考尔¹和Naresh加戈²

M。理工大学的学生,CSE的部门,广州PTU校园,珀,印度
CSE学系助理教授,广州PTU校园,珀,印度

文摘

随着信息技术的持续增长,新的开发工具和方法是利用在孤立的字符识别。孤立的字符的识别是一个过程,识别单个字符。是有用的在现实世界各种各样的问题,如文档分析、邮寄地址解释,银行支票处理、签名验证、文档验证和许多其他人。由于应用程序识别,模式识别的最具挑战性的领域之一。主题的研究已有很长一段时间。识别系统的性能在很大程度上依赖于使用什么功能。选择稳定的和代表的功能是识别系统的核心。

关键字

字符识别;特征提取;分类器;安;光学字符识别;神经网络;预处理;分割;培训

介绍

孤立的手写字符识别密集的主题研究在近几十年,因为它是有用的在各种各样的现实问题。一个孤立的性格是独自在一个孤立的形式写画,画在三个其他形式写时连接到其他角色的词。有两种类型的字符识别系统“在线和离线”[7]。每个系统都有自己的算法和方法。它们之间的主要区别是,在一个在线系统的识别是在时间写作而写作完成后执行离线识别。联机手写识别系统可用等掌上电脑pda可接受的性能。离线系统不如在线准确系统由于其信息数据捕捉设备较少,通常扫描器。然而,现在他们足够好,他们在专业领域产生重大经济影响等解释手写邮政地址的信封和阅读由银行支票。孤立的字符识别的最终目标是模拟人类的阅读能力。字符识别系统可以改善人与机器之间的交互在许多应用程序中[1][2]。 Some classifiers were based on neuronal networks [3] [4], on hidden Markov models [6], on affixed approach or the K-nearest neighbours [5]. The feature extraction method zoning, is used for extracting features of the character under consideration in this problem. In zoning method, the frame containing the character is divided into several overlapping or non-overlapping zones and the densities of object pixels in each zone are calculated. Densities are used to form a representation. The final, classification stage is the main decision making stage of the recognition system. It uses features extracted in the feature extraction stage to identify the character. K-Nearest Neighbor and Support Vector Machine are the two classifiers used for identifying the character in the problem.

比较各种研究在这个领域的成就是非常困难的数据库和一般方法可能不同。测试了不同的数据库会给结果变化和复杂的数据库中的数据是不一样的。类似的问题也与方法。方法将不同的字符,数字,话说,草书,non-cursive,有或没有后处理。

文献调查

不同领域的工作人员使用各种方法字符识别。几个讨论如下。乔治·伊、托马斯·a . Nartker[1]集中他们的研究工作的基础上的多样性时发生错误的字符识别和获取的图像。进一步他们短暂状态的多样性的基础上,他们遇到了错误,我们都倾向于相信在OCR进一步进展更可能是多种技术组合的结果比任何单一的发现新的首要原则。他们在这个舞台上的贡献是显著的。维贾伊克斯和Babita Kubde[7]提出了一种快速、简单的方法使用特征提取性能好,关注孤立的角色。Diagnol特征提取方案,提出为了使精度和更好的结果。沙Araokar[3]他们的工作集中在建立神经网络(人工)的对比图像的分类。人工神经网络是由隐藏层和输入和输出层。正确的训练方法有助于分类的神经网络的测试。 Net. train method is the remarkable method added in the simulator of MATLAB which requires a training set and a target set. . Holger Schwenk and Yoshua Benjio[6] Proposed a boosting algorithm AdaBoost, that has been applied with great success to several benchmark machine learning problems. In particular it is used to automatically learn a variety of learning styles when the amount of training data for each style varies alot. . Ankit Sharma and Dipti R. Chaudary[5] Provided a useful method for the recognition of handwritten characters to a great extent. The proposed method has been applied on different unknown characters. Neural network based method gives the accuracy 85 %. Developed Proposed algorithms cannot be applied to recognize a cursive handwriting Recognition. . Vivek Shrivastava and Navdeep Sharma [2] Presented their work mainly focused on the feature extraction of the image. They briefly state that, feature extraction is a very important step in order to make a successful classification of the image. Their statement towards this work is quite absolute as the features saved in the database decide what exactly is going to be the output of the classification.

孤立的字符的分割和识别

答:注册参考图像

首先,所有的特征点检测的参考图像,并注册的位置。这个职位由投票表示向量的信息如图1所示。

让原点参考图像的左上角。让N^(k)_我出现的次数i特性的参考图像的性格k让(xij yij) j的坐标出现字符i特性的k。投票向量定义为

此外,总数出现八个功能定义字符k的参考图像。首先,所有的特征点检测从输入图像。然后,字符被投票。同时,类别的特征和它的位置是由投票决定投票。简而言之,点左上角的候选人投票的字符图像如图2所示。允许变形的人物形象,邻居们的投票也投票。

首先,所有的特征点检测从输入图像。然后,字符被投票。同时,类别的特征和它的位置是由投票决定投票。简而言之,点左上角的候选人投票的字符图像如图2所示。允许变形的人物形象,邻居们的投票也投票。

让v (k) ij (x, y)投票值,即字符的投票值k (x, y)的输入图像。提前,初始化为v (k) ij (x, y) = 0的所有(x, y)和k。r中的邻居像素距离投票决定。

总结后投票,投票值。

V (k) (x, y)代表一种可能性,即字符图像的左上角类别k存在(x, y)。让T2是字符分割的阈值where0≤T2≤1。

光学字符识别

缩写为OCR,光学字符识别是孤立的字符的图像转换的过程中,打字或印刷文本(通常是被一个扫描器)成机器可编辑文本或计算机过程可以格式,如ASCII代码。计算机系统配备OCR系统提高输入操作的速度,减少数据输入错误,减少纸质文档所需的存储空间,从而使紧凑存储、快速检索、扫描修正等文件操作。OCR应用在邮政编码识别、自动数据进入大型管理系统、银行、自动制图、三维物体识别,数字图书馆,发票和收据处理,盲人阅读设备和个人数字助理。OCR包括模式识别的关键问题。准确性、灵活性和速度的三个主要特征是一个好的OCR系统。OCR的目的是使计算机能够识别光学符号而无需人工干预。这是通过搜索之间的匹配特性从一个给定的符号的形象和图书馆的形象模型。OCR系统的基本过程是图3所示。

光学字符识别的任何脚本的过程可以大致分为6个阶段,如图3所示。

光学字符识别的基本步骤:

我。数字化:数字化生产数字图像,这是美联储的预处理阶段。

二世。预处理:数字化产生的图像可能会携带一些不需要的噪声。需要在原始图像预处理阶段,减少噪音和失真,删除的偏态和执行skeltonizing形象。预处理阶段后,我们有一个去清理图像分割阶段。

三世。细分:需要在图像分割阶段和区分不同的逻辑部分,像一段,字行和字符的一个字。

四、特征提取:分割后,要求每个字符的功能。在特征提取阶段每一个字符都被分配一个特征向量来确定。这个向量是用来区分角色与其他角色。各种特征提取方法设计分区,主成分分析,中央的时刻,结构特点,伽柏过滤器和定向分布的距离。特征提取的过程选择的类型和一组功能。

诉分类:分类是主要的OCR系统的决策阶段。它使用在前一个阶段特征提取识别文本段根据预设规则。许多类型的分类器适用于OCR喜欢再邻居Neocognitrons和支持向量机。

vi。后加工:分类的输出可能包含一些识别错误。后处理方法消除这些错误主要利用两种方法即字典查找和统计方法。

孤立的字符识别的一般步骤

模糊逻辑是首先由Lotfi陈守煜[8]。这是为解决决策问题与开发„if - then ?规则后,它被用来处理不确定和不精确的数据管理。多年模糊逻辑应用于不同的申请,如自动控制、消费品、[9]的工业系统,汽车,决策分析、医学、地质学、控制飞机飞行,化学反应器和流程和应用专家系统等人工智能,模式识别和机器人。模糊逻辑比二进制更一般的逻辑系统。模糊逻辑的普遍性是需要处理复杂的问题领域的搜索。模糊逻辑提供了一个基础的发展新的工具来处理自然语言和知识表示。如沉淀自然语言、理论层次可定义性,不确定性的统一理论[10]。它的优点比二进制逻辑没什么不同,除了二进制逻辑工作只有两个层次((0,1)但是模糊逻辑处理假说是正确的确认程度(0,1)之间的现实的真实值假设表示强调的程度的前提是正确的。模糊逻辑简单的方法得出明确的结论基于模糊,模糊的和不精确的噪音,因此,合理控制个人快速决定[11][12]。 There are many motives that prompted scientists to develop fuzzy logic with the development of computer software and created a desire to invent or programming systems could deal with the information of others as human minute but this problem was born as the computer cannot deal only with specific and accurate information, has resulted in this trend known as expert systems and artificial intelligence, fuzzy logic is one theory in which to build these systems. There are many concepts of fuzzy logic such as fuzzy set theory, fuzzy logic operations (complement operation, union operations and the intersection operation) these operations can be also applied on binary sets [13].

结论

孤立的字符识别密集的主题研究在近几十年,因为它是有用的在各种各样的现实问题。模糊逻辑的实现使用很少的内存,从而能够提供完整的功能。爆炸的信息技术帮助OCR的面积快速增长。复杂的算法对孤立的字符识别系统开发。强大的计算机和更精确的电子设备,高效、现代的使用方法,如神经网络(NNs),隐马尔科夫模型(HMM),模糊集推理和自然语言处理是有可能的。然而,还有很长的路要走以达到最终目标的机器模拟人类阅读流利,尤其是对无约束的在线和离线笔迹。研究该地区广泛的更多可以做在改善的百分比精度不一定还在试图降低复杂性的预处理技术,其分类器,后处理,也需要巨大的数据库培训。

数据乍一看


图1	图2	图3	图4

引用

Abdel wahabzramdini Rolf英格尔德”,从投影光学字体识别档案”,为电子出版、6卷,1993年。

艾哈迈德·m·泽克和穆罕默德扎卡里亚,2004年,阿拉伯语字符的识别“挑战”国际伊斯兰Universityalaysia (IIUM),吉隆坡.Malaysia)。

BrigetteKrantz,“脆”,介绍模糊逻辑,科罗拉多大学”。

陈,G。,Pham T., 2001, “Introduction to fuzzy sets, fuzzy logic, and fuzzy control systems,”.

H。AL-Yousefi, S。Udpa,“阿拉伯语字符的识别”,IEEE模式分析与机器智能,第九卷

Korsheed m . s . 2002年,“离线阿拉伯语字符识别审查,”Anal.Appl.5模式。

Lorigo, L。,Govindaraju, V., “Offline Arabic handwriting recognition: A survey,” IEEE Trans.on Pattern Anal. Machine Intell. 28, 2006.

Majida阿里Abed哈米德·阿里在床上,“模糊逻辑方法识别孤立的阿拉伯语字符,“国际期刊ofComputer理论和工程,2卷,2010年2月1号1793 - 8201 - pp.9 - 17所示。

Margner, V。,Pechwitz, M, “Arabic handwriting recognition competition,” The8th International Conference on Document Analysis andRecognition,vol.1, ICDAR 2005.

穆罕默德。哈迪,易卜拉欣al-Hamdi”决策的模糊逻辑”,阿拉伯《管理科学。卷6,科威特。1999年。

Ruspini E。,1992,“Introductio n to Fuzzy set theory basic concepts And structures”, IEEE.

陈守煜,Lotfi a . 2004,“模糊逻辑系统:概念、起源和趋势)。

陈守煜,Lotfi a ., 1998,“模糊逻辑的计算机”,第22卷,问题4。