Document recognizing program, document recognizing apparatus and document recognizing method



【課題】認識した帳票データの訂正作業において、訂正作業者の負担を軽減することを課題とする。 【解決手段】この帳票認識装置は、各種の帳票に対応付けて、当該帳票を構成する複数の文字列それぞれを示す論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、入力された帳票を認識し、論理構造雛形記憶部に記憶される論理要素と一致する文字列と、論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせとを抽出して格納し、格納された帳票データと、認識された帳票画像とをそれぞれ表示部に出力し、表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を特定して、特定した文字列を他の文字列と区別して表示部に表示出力するとともに、帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する。 【選択図】 図1
<P>PROBLEM TO BE SOLVED: To reduce the burden of a data correction operator in the data correction work of recognized document data. <P>SOLUTION: The document recognizing apparatus includes a logical structure model storing section that stores a logical structure indicating logical elements showing a plurality of character strings configuring a document and a relationship among the logical elements in association with various documents, and extracts and stores, with respect to a document image obtained by recognizing the input document, character strings coinciding with the logical elements stored in the logical structure model storing section and a combination of the character strings on the document satisfying the relationship among the logical elements stored in the logical structure model storing section, and outputs the stored document data and the recognized document image to a display section, and when a character string of the document data displayed on the display section is selected by a user, specifies a character string related to the selected character string, and displays document data in which the specified character string is distinguished from the other character strings on the display section, and displays a minimum area including the specified character string of the document data of the document image on the display section. <P>COPYRIGHT: (C)2009,JPO&INPIT




Download Full PDF Version (Non-Commercial Use)

Patent Citations (6)

    Publication numberPublication dateAssigneeTitle
    JP-2002007951-AJanuary 11, 2002Hitachi Ltd, Hitachi Software Eng Co Ltd, 日立ソフトウエアエンジニアリング株式会社, 株式会社日立製作所Slip input method, its execution device, and storage medium recording its process program
    JP-2003223610-AAugust 08, 2003Toshiba Corp, 株式会社東芝Character recognizing device and character recognizing method
    JP-H05158984-AJune 25, 1993Ricoh Co Ltd, 株式会社リコーDevice for extracting character string
    JP-H0668300-AMarch 11, 1994Internatl Business Mach Corp , インターナショナル・ビジネス・マシーンズ・コーポレイションMethod fur preparing layout model of document picture and device therefor
    JP-H07134750-AMay 23, 1995Nec Corp, 日本電気株式会社Document image recognizing device
    JP-H11353411-ADecember 24, 1999Oki Electric Ind Co Ltd, 沖電気工業株式会社文字認識装置

NO-Patent Citations (0)


Cited By (1)

    Publication numberPublication dateAssigneeTitle
    JP-2011198285-AOctober 06, 2011Hitachi Solutions Ltd, 株式会社日立ソリューションズDocument processing system and program