ポートフォリオを新規に作成して保存 |
|
|
既存のポートフォリオに追加保存 |
|
PDFをダウンロード |
審決分類 |
審判 全部申し立て 2項進歩性 G06K |
---|---|
管理番号 | 1366943 |
異議申立番号 | 異議2020-700040 |
総通号数 | 251 |
発行国 | 日本国特許庁(JP) |
公報種別 | 特許決定公報 |
発行日 | 2020-11-27 |
種別 | 異議の決定 |
異議申立日 | 2020-01-24 |
確定日 | 2020-08-14 |
異議申立件数 | 1 |
訂正明細書 | 有 |
事件の表示 | 特許第6550163号発明「文字認識装置、文字認識方法およびプログラム」の特許異議申立事件について、次のとおり決定する。 |
結論 | 特許第6550163号の特許請求の範囲を訂正請求書に添付された訂正特許請求の範囲のとおり,訂正後の請求項7について訂正することを認める。 特許第6550163号の請求項1?6,8,9に係る特許を維持する。 特許第6550163号の請求項7に係る特許についての特許異議の申立てを却下する。 |
理由 |
1 手続の経緯 特許第6550163号の請求項1?9に係る特許についての出願は,平成30年3月29日に出願され,令和1年7月5日にその特許権の設定登録がされ,令和1年7月24日に特許掲載公報が発行された。その後,その特許について,令和2年1月24日に特許異議申立人 笹井 栄治(以下,「申立人」という。)より請求項1?9(全請求項)に対して特許異議の申立てがされ,当審は,令和2年5月7日付けで取消理由を通知した。特許権者は,その指定期間内である令和2年7月6日に意見書の提出及び訂正の請求(以下,「本件訂正請求」という。)を行った。 なお,本件訂正請求による訂正事項は,請求項7を削除するというもののみであって,特許法第120条の5第5項ただし書に規定する「特許異議申立人に意見書を提出する機会を与える必要がないと認められる特別な事情があるとき」に該当するから,申立人に意見書を提出する機会を与えなかった。 2 訂正の適否 (1)訂正の内容 本件訂正請求による訂正の内容は,次のとおりである。 ア 訂正事項1 特許請求の範囲の請求項7を削除する。 (2)訂正の目的の適否,新規事項の有無,及び特許請求の範囲の拡張・変更の存否 訂正事項1は,訂正前の請求項7を削除するものであるから,特許請求の範囲の減縮を目的とするものである。 また,訂正事項1は,願書に添付した明細書,特許請求の範囲又は図面に記載した事項の範囲内のものであり,実質上特許請求の範囲を拡張し,又は変更するものではない。 (3)小括 上記のとおり,本件訂正請求に係る訂正は,特許法第120条の5第2項ただし書第1号に掲げる事項を目的とするものであり,かつ,同条第9項で準用する同法第126条第5項及び第6項の規定に適合する。 したがって,特許請求の範囲を,訂正請求書に添付された訂正特許請求の範囲のとおり,訂正後の請求項7について訂正することを認める。 3 本件特許発明 本件訂正請求により訂正された請求項1ないし9に係る発明(以下,「本件特許発明1」ないし「本件特許発明9」という。)は,それぞれ,訂正請求書に添付された訂正特許請求の範囲の請求項1ないし9に記載された事項により特定される次のとおりのものである。 なお,本件特許発明1の各構成にA?Fの記号を付し,以下,「構成A」?「構成F」という。 「【請求項1】 A 証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と, B 証券の画像データを取得し,前記位置格納部を参照することにより,前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と, C 前記複数のフィールドを特定する情報のそれぞれに対応して,前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と, D 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を,学習機能と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と を備え, E 前記文字推定部は,前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を,学習機能を用いて推定する第1の推定部と,前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と,を含む, F 文字認識装置。 【請求項2】 前記複数のフィールドのいずれかは住所のフィールドであり, 前記住所のフィールドに対応する前記辞書には,都道府県名,市区町村名および地域名の可能な組み合わせが階層化されて登録されており, 前記文字推定部は,都道府県名,市区町村名および地域名ごとに前記文字列を推定する請求項1に記載の文字認識装置。 【請求項3】 前記住所のフィールドに対応する前記辞書には,行政上の変更があった都道府県名,市区町村名および地域名について,旧名称と現名称とが対応付けられて登録されており, 前記文字推定部は,推定した文字列が前記旧名称である場合には前記旧名称に対応付けられている前記現名称を少なくとも出力する請求項2に記載の文字認識装置。 【請求項4】 前記複数のフィールドのいずれかは年を含むフィールドであり, 前記年を含むフィールドに対応する前記辞書には,西暦と元号とが対応付けられて登録されており, 前記文字推定部は,推定した文字列が前記元号である場合には前記元号に対応付けられている前記西暦による年を少なくとも出力する請求項1から3のいずれか1項に記載の文字認識装置。 【請求項5】 前記複数のフィールドのいずれかは年を含むフィールドであり,他のいずれかは前記年に関連する内容を含むフィールドであり, 前記年に関連する内容を含むフィールドに対応する前記辞書には,前記年および前記内容の組み合わせが登録されており, 前記文字推定部は,前記年を含むフィールドで推定した前記年を用いて,前記年に関連する内容を含むフィールドに対応する前記辞書を参照する請求項1から4のいずれか1項に記載の文字認識装置。 【請求項6】 前記年を含むフィールドは車検の初度登録の日付のフィールドであり,前記年に関連する内容を含むフィールドは車の型式のフィールドである請求項5に記載の文字認識装置。 【請求項7】 (削除) 【請求項8】 証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに, 前記複数のフィールドを特定する情報のそれぞれに対応して,前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されており, 証券の画像データを取得し,前記位置格納部を参照することにより,前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定段階と, 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を,学習機能と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定段階と を備える,前記文字推定段階は,前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を,学習機能を用いて推定する第1の推定段階と,前記第1の推定段階で推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定段階と,を含む,文字認識方法。 【請求項9】 証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに, 前記複数のフィールドを特定する情報のそれぞれに対応して,前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されている, コンピュータに 証券の画像データを取得し,前記位置格納部を参照することにより,前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定手順,および, 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を,学習機能と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定手順を実行させ,前記文字推定手順は,前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を,学習機能を用いて推定する第1の推定手順と,前記第1の推定手順が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定手順と,を含む,プログラム。」 4 取消理由通知に記載した取消理由について (1)取消理由の概要 訂正前の請求項7に係る特許に対して,当審が令和2年5月7日付けで特許権者に通知した取消理由の要旨は,次のとおりである。 ア 請求項7に係る発明は,甲第1号証に記載された発明,甲第5号証に記載された技術及び周知技術に基いて,当業者が容易に想到することができたものである。よって,請求項7に係る特許は,特許法第29条第2項の規定に違反してされたものであり,取り消されるべきものである。 イ 請求項7に係る発明は,甲第2号証-1に記載された発明及び甲第5号証に記載された技術に基いて,当業者が容易に想到することができたものである。よって,請求項7に係る特許は,特許法第29条第2項の規定に違反してされたものであり,取り消されるべきものである。 (2)当審の判断 取消理由通知で指摘した請求項7は,本件訂正請求により削除されたことから,当審で通知した取消理由はその対象が存在しないものとなった。 5 取消理由通知において採用しなかった特許異議申立理由について (1)特許異議申立書に記載された申立理由の概要 ア 申立理由1 請求項1?9に係る発明は,甲第1号証に記載された発明及び甲第2号証-1?甲第5号証に記載された発明に基いて,当業者が容易に想到することができたものである。よって,請求項1?9に係る特許は,特許法第29条第2項の規定に違反してされたものであり,取り消されるべきものである。 イ 申立理由2 請求項1?9に係る発明は,甲第2号証-1,甲第2号証-2に記載された発明及び甲第3号証?甲第5号証に記載された発明に基いて,当業者が容易に想到することができたものである。よって,請求項1?9に係る特許は,特許法第29条第2項の規定に違反してされたものであり,取り消されるべきものである。 ウ 証拠方法 甲第1号証 :特開2018-36998号公報 甲第2号証-1:パンフレット「帳票OCRシリーズFormOCR 手書き文字/活字文字認識対応帳票OCRソフトウェア v.7.0」,株式会社エヌジェーケー,2017年4月 甲第2号証-2:『帳票OCRソフト「FormOCRv.7.0」を提供開始』,株式会社NTTデータNJKホームページ,メディアドライブ株式会社製品紹介ページ,[online],2017年3月29日,[検索日2020年1月17日],インターネット<https://mediadrive.jp/topics/2017/formocr7.html> 甲第3号証 :特開2012-8791号公報 甲第4号証 :浜村倫行,“郵便・物流自動化システム用住所認識技術の性能向上”,東芝レビュー,Vol.70 No.4,P18-21,株式会社東芝,2015年4月1日 甲第5号証 :特開2015-52933号公報 (2)甲第1号証?甲第5号証の記載事項及び甲1発明,甲2発明 (2-1)甲第1号証の記載事項 甲第1号証には以下の記載がある。 ア 「【0016】 本実施の形態の保険証券画像解析システム10は,携帯端末20と,記載内容解析装置30と,画像記憶装置40と,分析装置50と,を有する。この保険証券画像解析システム10は,保険証券11に記載された保険の契約内容を分析する。保険とは,たとえば,生命保険や損害保険である。」 イ 「【0018】 記載内容解析装置30は,受信手段31と項目名記憶部32と文字情報抽出部33と検索部34と抽出データ記憶部35と個人情報項目名記憶部36と個人情報検索部37と画像データ送信部38とを備えている。記載内容解析装置30は,たとえばインターネットに直接的にまたは間接的に接続された1台または複数台のコンピュータである。 【0019】 受信手段31は,携帯端末20のカメラ23で撮影され,携帯端末20の送信手段で送信された保険証券11の画像(保険証券画像)を受信する。 【0020】 項目名記憶部32は,複数の項目名を記憶する。ここで,項目名とは,「保険契約人」,「被保険人」,「受取人」,「主契約」,「特約」などの保険契約に用いられる可能性がある語句である。項目名記憶部32は,このような項目名のリストを記憶する部分と,項目名として記憶された単語の類義語を記憶した類義語記憶部との組み合わせであってもよい。 【0021】 文字情報抽出部33は,保険証券画像から文字情報を抽出する。文字情報の抽出は,たとえば一般的なOCR技術を用いることができる。保険証券には,枠線や罫線が用いられていることが多い。文字情報抽出部33による文字情報の抽出において,枠線や罫線の存在を利用してもよい。たとえば,枠線や罫線によって分割された領域をそれぞれブロックとして取り扱ったり,枠線や罫線を水平の把握のためのガイドとして取り扱ったりしてもよい。また,文字情報抽出部33において,保険証券画像の台形補正などの補正を行ってもよい。 【0022】 検索部34は,文字情報抽出部33が抽出した文字情報のそれぞれについて,項目名記憶部32に記憶された項目名に一致するものを検索する。抽出データ記憶部35は,文字情報抽出部33が抽出した文字情報と一致する項目名が存在した場合には,その文字情報をキーとし,その文字情報に対応する位置に印刷された文字情報をバリューとして記憶する。つまり,項目名のキーと,その項目名の項目の値のバリューとを組として記憶する。 【0023】 バリューは,たとえばキーが印刷された位置の右側の最も近い位置にある文字列とすることができる。バリューの特定においては,たとえば項目名に対して,可能性があるバリューの範囲となるかどうかを判定したり,バリューの値の候補リストに含まれるか否かを判定して,特定精度を上げることができる。 【0024】 バリューの特定には,論理距離を用いてもよい。ここで,論理距離とは,実際の記載位置間の距離に,文書上の語句の記載位置の制約を加味した仮想的な距離である。文書上の語句の記載位置の制約とは,日本語の横書きの場合には,文字は,左から右に向かって,上から下に向かって記載されるこ,罫線が存在する場合には罫線に沿って記載されること,枠線で囲まれている領域内に存在する文字は一群の意味を形成していること,などである。たとえば,キーに対して右側および下側に文字が存在している場合には,実際の距離をベースとして,キーと文字との間に罫線や枠線などの線が存在するときに,定数倍する,あるいは,定数を加えるなどとする。また,キーに対して上方あるいは左側に文字が存在する場合には,実際の距離の定数倍あるいは定数を加えたものをベースとする。 【0025】 また,保険証券画像の特徴からフォーマットを特定した後にバリューを特定してもよい。ここでフォーマットとは,特定の保険会社や保険商品などの種類ごとに共通に用いられる文書の形式である。フォーマットが特定されると,どの位置にどのような情報が記載されるかがわかるため,記載位置に基づいてバリューを特定することができる。」 ウ 「【0042】 また,本実施の形態の保険証券画像解析システム10では,個人情報を除去した状態で保険証券の画像データを保存しているので,顧客が個人情報の流出・漏えいを危惧する必要がない。一方,保険証券の画像データを保存しているため,抽出データに誤りがないかどうかをユーザが目視しながら確認することができる。 【0043】 さらに,保険証券画像解析システム10は,保険証券の画像データに基づいて,学習をしてデータの抽出精度を高めてもよい。たとえば,保険証券は保険会社・保険商品ごとにフォーマットが異なっているため,罫線などによって特定されるフォーマットから保険会社・保険商品を特定し,特定された保険会社・保険商品に用いられる語句やフォントなどを把握して,精度を高めることができる。この学習には,ユーザによる目視の確認結果を反映させてもよい。保険証券の画像データを保存しておくことにより,学習の方法を随時変更し,過去にさかのぼって学習させることもできる。」 (2-2)甲1発明 上記(2-1)のア?ウの記載から,甲第1号証には以下の発明(以下,「甲1発明」という。)が記載されていると認められる。 なお,a1?k1は,説明のために付したものであり,以下,「構成a1」?「構成k1」という。 <甲1発明> a1 保険証券画像解析システム10における記載内容解析装置30であって,(段落0016) b1 受信手段31と項目名記憶部32と文字情報抽出部33と検索部34と抽出データ記憶部35と個人情報項目名記憶部36と個人情報検索部37と画像データ送信部38とを備え,(段落0018) c1 受信手段31は,携帯端末20のカメラ23で撮影され,携帯端末20の送信手段で送信された保険証券11の画像(保険証券画像)を受信し,(段落0019) d1 項目名記憶部32は,複数の項目名を記憶しており,ここで,項目名とは,「保険契約人」,「被保険人」,「受取人」,「主契約」,「特約」などの保険契約に用いられる可能性がある語句であり,項目名記憶部32は,このような項目名のリストを記憶する部分と,項目名として記憶された単語の類義語を記憶した類義語記憶部との組み合わせであってもよく,(段落0020) e1 文字情報抽出部33は,保険証券画像から文字情報を抽出するものであり,文字情報の抽出は,たとえば一般的なOCR技術を用いることができ,文字情報抽出部33による文字情報の抽出において,枠線や罫線の存在を利用してもよく,たとえば,枠線や罫線によって分割された領域をそれぞれブロックとして取り扱ったりしてもよく,(段落0021) f1 検索部34は,文字情報抽出部33が抽出した文字情報のそれぞれについて,項目名記憶部32に記憶された項目名に一致するものを検索し,抽出データ記憶部35は,文字情報抽出部33が抽出した文字情報と一致する項目名が存在した場合には,その文字情報をキーとし,その文字情報に対応する位置に印刷された文字情報をバリューとして記憶する,つまり,項目名のキーと,その項目名の項目の値のバリューとを組として記憶し,(段落022) g1 バリューは,たとえばキーが印刷された位置の右側の最も近い位置にある文字列とすることができ,バリューの特定においては,たとえば項目名に対して,可能性があるバリューの範囲となるかどうかを判定したり,バリューの値の候補リストに含まれるか否かを判定して,特定精度を上げることができ,(段落0023) h1 バリューの特定には,論理距離を用いてもよく,ここで,論理距離とは,実際の記載位置間の距離に,文書上の語句の記載位置の制約を加味した仮想的な距離であり,文書上の語句の記載位置の制約とは,日本語の横書きの場合には,文字は,左から右に向かって,上から下に向かって記載されること,罫線が存在する場合には罫線に沿って記載されること,枠線で囲まれている領域内に存在する文字は一群の意味を形成していること,などであり,(段落0024) i1 また,保険証券画像の特徴からフォーマットを特定した後にバリューを特定してもよく,ここでフォーマットとは,特定の保険会社や保険商品などの種類ごとに共通に用いられる文書の形式であり,フォーマットが特定されると,どの位置にどのような情報が記載されるかがわかるため,記載位置に基づいてバリューを特定することができ,(段落0025) j1 保険証券画像解析システム10では,保険証券の画像データを保存しているため,抽出データに誤りがないかどうかをユーザが目視しながら確認することができ,(段落0042) k1 保険証券画像解析システム10は,保険証券の画像データに基づいて,学習をしてデータの抽出精度を高めてもよく,たとえば,保険証券は保険会社・保険商品ごとにフォーマットが異なっているため,罫線などによって特定されるフォーマットから保険会社・保険商品を特定し,特定された保険会社・保険商品に用いられる語句やフォントなどを把握して,精度を高めることができ,この学習には,ユーザによる目視の確認結果を反映させてもよく,保険証券の画像データを保存しておくことにより,学習の方法を随時変更し,過去にさかのぼって学習させることもできる,(段落0043) a1 記載内容解析装置30。 (2-3)甲第2号証-1の記載事項 甲第2号証-1は「手書き文字/活字文字認識対応の帳票OCRソフトウェア」のパンフレットであり,以下の記載がある。 ア 「知識処理 姓名辞書(表記と読みの併用処理が可能・登録件数51,000件) 郵便番号辞書(表記と読みの併用処理が可能) ユーザー辞書(全角50文字以内で2階層まで登録可能) 学習機能 手書きの癖字,活字の特殊な字体を登録」(1ページ目,「FormOCR V. 7.0仕様」) イ 「 」(1ページ目,製品名と主な仕様の対応表) ウ 「■学習機能 活字・印字文字の特殊字体(フォント)や手書きの癖字など,文字をその場で登録(学習)させることで認識精度が向上します。 ■知識処理機能 姓名辞書・便番号辞書(住所辞書)との照合を行うことで,認識精度が向上します。ユーザー特有の単語辞書やコード辞書の作成も可能で,これらの辞書と単語照会を行うことで,さらに認識精度を向上させることができます。」(2ページ目,「1.認識精度」の欄) エ 「■Excel作成の帳票利用 OCR用の帳票はExcel等を利用して作成できます。OCR専用帳票と異なり,帳票レイアウトや内容の変更も容易に可能です。コピー用紙(普通紙)の利用ができますので,ランニングコストが低減できます。作成した帳票のフォーマット設定は,帳票をスキャンして,OCR読み取り領域と属性(読み取り文字種・桁数など)を指定するだけで可能です。」(2ページ目,「2.簡単導入」の欄) オ 「■カラー帳票対応 入学願書や履歴書などの帳票に含まれるカラー写真部分の出力や車検証や証券などの地紋が入った帳票の読み取りが可能です。」(2ページ目,「2.簡単導入」の欄) カ 「■簡単フォーマット設定 読み取り領域(フィールド)設定は自動抽出機能で簡単に設定できます。フィールドの読取り文字種・桁数などの属性やテキスト出力順の指定,ゼロ詰,空白削除,編集文字付加等のテキスト出力の編集も容易です。」(2ページ目,「2.簡単導入」の欄) キ 「■紙を見るイメージの確認・訂正画面 帳票イメージの上に認識結果が同時に表示されますので,簡単に認識結果の訂正が可能です。」(2ページ目,「2.簡単導入」の欄) ク 「 」(2ページ目,「2.簡単導入」の欄) (2-4)甲2発明 上記(2-3)のア?クの記載から,甲第2号証-1には以下の発明(以下,「甲2発明」という。)が記載されていると認められる。 なお,異議申立書の30?31頁では,甲第2号証-1と甲第2号証ー2の両者の記載を合わせて甲2発明を認定しているが,甲第2号証-1と甲第2号証ー2とは異なる刊行物であり,これらの記載を合わせて「刊行物に記載された発明」を認定することはできないため,甲第2号証-1と甲第2号証ー2のうち,より適切と判断された甲第2号証ー1を採用して甲2発明を認定した。 また,a2?f2は,説明のために付したものであり,以下,「構成a2」?「構成f2」という。 <甲2発明> a2 手書き文字/活字文字認識対応の帳票OCRソフトウェアであって, b2 表記と読みの併用処理が可能で登録件数51,000件の姓名辞書,表記と読みの併用処理が可能な郵便番号辞書,及び全角50文字以内で2階層まで登録可能なユーザー辞書を備え,姓名辞書・便番号辞書(住所辞書)との照合を行うことで,認識精度を向上させることができ,また,ユーザー特有の単語辞書やコード辞書の作成も可能で,これらの辞書と単語照会を行うことで,さらに認識精度を向上させることができる知識処理機能と, c2 活字・印字文字の特殊字体(フォント)や手書きの癖字など,文字をその場で登録(学習)させることで認識精度を向上させることができる学習機能とを備え, d2 OCR用の帳票はExcel等を利用して作成でき,OCR専用帳票と異なり,帳票レイアウトや内容の変更も容易に可能で,作成した帳票のフォーマット設定は,帳票をスキャンして,OCR読み取り領域と属性(読み取り文字種・桁数など)を指定するだけで可能で,読み取り領域(フィールド)設定は自動抽出機能で簡単に設定でき,フィールドの読取り文字種・桁数などの属性やテキスト出力順の指定,ゼロ詰,空白削除,編集文字付加等のテキスト出力の編集も容易であり, e2 入学願書や履歴書などの帳票に含まれるカラー写真部分の出力や車検証や証券などの地紋が入った帳票の読み取りも可能であり, f2 帳票イメージの上に認識結果が同時に表示されるので,簡単に認識結果の訂正が可能である, a2 帳票OCRソフトウェア。 (2-5)甲第2号証-2の記載事項 ア 「3.自由手書きの「氏名/住所」認識精度向上 「姓名/住所」の自由欄への認識精度が大幅に改善しました。」(2ページ目)) イ 「 」 (2-6)甲第3号証の記載事項 ア 「【請求項1】 帳票を光学的に走査することによって得られた帳票画像を取得するイメージ入力部と, 前記イメージ入力部によって取得された帳票画像から押印画像を検出する押印画像検出部と, 前記押印画像の輪郭の色を示す押印色とその他の色とを分離する背景色分離部と, 前記背景色分離部によって前記押印色が前記その他の色と分離された前記押印画像の傾きを補正する傾き補正部と, 前記傾き補正部によって傾きが補正された前記押印画像から文字列を探索し,前記探索された文字列を切り出す文字列探索部と, 前記文字列探索部によって切り出された文字列から,前記文字列を構成する各文字を切り出す文字切出部と, 前記文字切出部によって切り出された各文字を認識し,前記文字列を構成するすべての文字を認識した結果を示す文字認識結果を算出し,前記認識された各文字の信頼度を算出する文字認識部と, 前記文字認識部によって算出された文字認識結果から,予め指定された文字列形式に適合する文字認識結果を選択し,前記選択された文字認識結果に対する信頼度を前記文字認識部によって算出された各文字の信頼度に基づいて算出する知識処理部と, 前記知識処理部によって選択された文字認識結果と当該文字認識結果の信頼度とに基づいて,前記知識処理部によって選択された文字認識結果を棄却するか否かを判定する棄却判定部と, 前記棄却判定部によって前記文字認識部による文字認識結果が棄却された場合に,押印画像の文字を再度認識させるか否かを判定するリトライ判定部と,を備えることを特徴とする帳票認識装置。」 イ 「【0139】 本発明の第2実施形態の帳票認識装置101によって実行される処理は,帳票に存在する押印を認識する認識フェーズ(帳票認識処理)と,押印を認識するために参照する押印認識用辞書301を生成する学習フェーズ(押印認識用辞書生成処理)とによって構成される。 【0140】 認識フェーズでは,帳票認識装置101は,帳票に存在する押印を次々と認識し,押印に基づいて帳票を分類する。帳票認識装置101は,認識フェーズで,押印認識用辞書301を参照する場合もある。学習フェーズでは,帳票認識装置101は,認識結果DB203に記録された認識結果,又はユーザによって入力された定義に基づいて,押印認識用辞書301を生成する。 【0141】 認識フェーズを実行するためのモジュール及びデータベースを図12に示し,学習フェーズを実行するためのモジュール及びデータベースを図14に示す。 【0142】 本実施形態では,認識フェーズの処理を実行する装置(認識装置)と学習フェーズの処理を実行する装置(押印認識用辞書生成装置)とは帳票認識装置101によって実行されるものとするが,別々の装置によって実行されてもよい。認識フェーズの処理と学習フェーズの処理とが別々の装置によって実行される場合,認識フェーズの処理を実行する認識装置は図12に示すモジュールを備え,押印認識用辞書生成装置によって生成された押印認識用辞書を用いて,入力帳票に存在する押印を認識する。学習フェーズの処理を実行する押印認識用辞書生成装置は図14に示すモジュールを備え,認識結果DB203に記録されている認識結果,及びユーザによって入力された定義に基づいて,押印認識用辞書301を生成する。各モジュールの処理は,演算装置106によって実行される。 【0143】 図12は,本発明の第2の実施形態の帳票認識装置101による帳票認識処理を実行する各モジュールを説明するための図である。図12に示すモジュールのうち本発明の第1の実施形態と同じモジュールは同じ番号を付与し,説明を省略する。 【0144】 本実施形態の帳票認識装置101は,イメージ入力部211,押印検出部212,背景色分離部213,傾き補正部214,辞書利用判定部315,文字列探索部316,文字切出部317,文字認識部318,知識処理部319,棄却判定部320,リトライ判定部321,認識結果記録部222,帳票分類部223,押印種特定部331,及び押印劣化判定部332を備え,知識処理部219が参照するデータベースとして知識処理用辞書202,認識結果記録部222が認識結果を記録するための認識結果DB203,及び押印種特定部331が参照するデータベースとして押印認識用辞書301を備える。 (中略) 【0155】 文字認識部318は,例えば,押印のかすれ度が大きい場合には,かすれ文字を学習した文字認識方法を用いて文字を認識し,押印のつぶれ度が大きい場合には,つぶれ文字を学習した文字認識方法を用いて文字を認識することによって,押印による文字の劣化に適した文字認識方法を用いることができ,文字認識の精度を向上できる。」 (2-7)甲第4号証の記載事項 ア 「 」(19ページ左上段) イ 「更に,各単語候補(日本語の場合は各行)を文字に分割する。詳細は後述するが,単語分割と同様に文字分割も複数の候補が考えられ,複数の文字候補が生成される。 生成された各文字候補に対し,文字認識を行う。文字認識は,特徴抽出処理と認識処理に分かれる。」(19ページ左欄3?7行) ウ 「こうした得られた特徴ベクトルを基に,認識処理を行う。認識処理にはSVM(Support Vector Machine)や,ニューラルネットワーク,部分空間法,疑似ベイズなど様々な一般パターン認識手法を用いることができ,性能の高い手法を採用している。文字認識結果,各アルファベットにスコアが付与された形式で表すことができる。図3では文字認識結果をスコアの順にソートして表示している。」(19ページ左欄14?20行) エ 「3.2 単語認識の枠組み 文字認識や単語辞書を利用すれば境目を決めることができるが,境目を決めないと文字認識が実行できないため,両者は鶏と卵の関係にある。この問題を解決するため,図4(b)に示すようにあらかじめ多数の分割候補を生成することが一般に行われている。境目の候補は,輪郭形状の変化や黒画素の密度変化などを利用して決める。図4(b)の上二つの各文字候補画像の下には,簡単のためスコア1位の文字だけを文字認識結果の例として示している。 これらの分割候補とその認識結果を,住所データベースから生成される単語辞書と照合し,全組合せの中でもっとも照合スコアの高い組み合わせを単語認識結果とするのが,一般的な単語認識の枠組みである。」(19ページ右欄18行?20ページ左欄1行) オ 「 」(19ページ右下段) カ 「4 手書き住所の認識 4.1 概要 郵便や物流の区分システムで最終的に必要な情報は,一つ一つの文字や単語の認識結果ではなく,住所である。住所はcity, street, street No.のように階層になっているため,図6(a)に示すように木構造で表すことができる。すなわち,住所認識はこの木構造の末端ノード,図6(a)の例ではstreet No.に属する八つのノードの中から正解を選び出す処理であり,木構造の探索問題と見做すことができる。 選び出すにあたり,全てのノードを対象に単語認識処理を行うのが理想的であるが,住所データベースの末端ノード数は数百万?数千万個あるため,膨大な処理時間が掛かる。そこで,制限時間内でいかに選び出すかが重要となる。一般には,上位階層から順に認識し,スコアの低いノードを枝刈りして絞り込むことで処理時間を削減する。」(20ページ左欄下から3行?右欄12行) キ 「 」(20ページ下段) (2-8)甲第5号証の記載事項 ア 「【請求項7】 前記生成部は,前記修正対象文字列の属性が,該文字列が姓名の名であることを示す姓属性であり,前記他の文字列の属性が,該文字列が生年月日であることを示す生年月日属性である場合に,前記他の文字列で示される年の人気名を前記置換文字列の候補として取得する前記条件を生成する,請求項1に記載の知識処理装置。 【請求項8】 前記生成部は,前記修正対象文字列の属性が,該文字列が姓名の名であることを示す名属性であり,前記他の文字列の属性が,該文字列が生年月日であることを示す生年月日属性である場合に,前記他の文字列で示される年の干支にちなんだ名前を前記置換文字列の候補として取得する前記条件を生成する,請求項1に記載の知識処理装置。 【請求項9】 前記生成部は,前記修正対象文字列の属性が,該文字列が姓名の名であることを示す名属性であり,前記他の文字列の属性が,該文字列が生年月日であることを示す生年月日属性である場合に,前記他の文字列で示される季節にちなんだ名前を前記置換文字列の候補として取得する前記条件を生成する,請求項1に記載の知識処理装置。」 イ 「【技術分野】 【0001】 本発明の実施形態は,知識辞書を用いて文字列の修正を行う知識処理装置,方法およびプログラムに関する。」 ウ 「【0011】 入力部101は,文書データDを入力する。文書データDは,複数の文字列を含み,各文字列にその属性が付されたデータである。文字列は,全体として意味を持つ文字の集合(単語など)である。属性は,文字列の意味の種別であり,例えば,姓名の「姓」属性,姓名の「名」属性,「住所」属性,「生年月日」属性などが挙げられる。文書データDは,文字列とその属性の他,文字列に関連するその他の情報を含んでいてもよい。本実施形態では,文書データDとして,OCRにより文字認識された文字列を含むものを用いる。この場合,文書データDに含まれるその他の情報としては,文字列を構成する各文字に対する文字認識の結果として得られた候補文字群などが挙げられる。 【0012】 図3は,文書データDの一例を示す図である。図3に示す文書データDは,文字列として「鈴木」,「太郎」,「1970年6月15日」,「東京都府中市・・・」などを含む。文字列「鈴木」には,属性として「姓」,文字列「太郎」には,属性として「名」,文字列「1970年6月15日」には,属性として「生年月日」,文字列「東京都府中市・・・」には,属性として「住所」がそれぞれ付されている。また,各文字列に関連するその他の情報として,文字列を構成する各文字の候補文字群などを含んでいる。 (中略) 【0016】 選択部104は,入力部101が入力した文書データDから,修正対象文字列を選択する。例えば,受付部103が修正対象文字列を指定するユーザ操作を受け付けた場合,選択部104は,ユーザにより指定された文字列を修正対象文字列として選択する。なお,選択部104は,ユーザの指定によらずに,予め定めた規則に従って文書データDから修正対象文字列を選択するようにしてもよい。例えば,予め定めた属性の文字列を順次,修正対象文字列として選択するといった方法や,文書データDに含まれるすべての文字列を順次,修正対象文字列として選択するといった方法などが考えられる。」 エ 「【0019】 特定部105は,選択部104により選択された修正対象文字列の属性に対応するデータベースを知識辞書Nから呼び出し,修正対象文字列をそのデータベースと照合して,置換文字列の特定を試みる。例えば,修正対象文字列の属性が「姓」属性の場合,特定部105は,知識辞書Nから姓DBを呼び出す。そして,特定部105は,修正対象文字列の各文字の候補文字群(パターンマッチングなどの文字認識により認識候補として取得された文字群)を含めた文字の組み合わせを求め,その組み合わせに一致する姓の文字列が姓DBに1つのみ存在する場合,その文字列を置換文字列として特定する。なお,修正対象文字列の各文字の候補文字群は,例えば,対応する文字(修正対象文字列に含まれる文字)に対する類似度(文字認識結果である各候補に与えられる「その文字(=答え)らしさ」の値,例えばユークリッド距離)が高い順に順位付けされた情報として与えられる。」 オ 「【0026】 生成部106は,例えば,特定部105が修正対象文字列を置換する置換文字列を一意に特定できなかった場合に,条件生成用文字列に基づいて,置換文字列の候補を取得する条件(以下,候補取得条件という。)を生成する。条件生成用文字列は,文書データDに含まれる文字列であって,修正対象文字列とは属性が異なる他の文字列である。条件生成用文字列は,上述したようにユーザ操作により指定された文字列であってもよいし,修正対象文字列の属性に対して予め定められた他の属性を持つ文字列であってもよい。例えば,処理対象文字列の属性が「姓」であれば,「住所」属性が付された文字列を条件生成用文字列として用いるといった規則や,処理対象文字列の属性が「名」であれば,「生年月日」属性が付された文字列を条件生成用文字列として用いるといった規則を定めておき,この規則に従って条件生成用文字列を決定することができる。 (中略) 【0028】 図9は,生成部106が「生年月日」属性の条件生成用文字列に基づいて「名」属性の修正対象文字列を置換する置換文字列の候補を取得するための候補取得条件を生成する例を説明する図である。条件生成用文字列の属性が「生年月日」であり,修正対象文字列の属性が「名」である場合,生成部106は,例えば,条件生成用文字列を解析して生まれ年を特定し,生まれ年の人気名のリストを取得するといった候補取得条件を生成することができる。図9の例では,生成部106が,「生年月日」属性の条件生成用文字列から生まれ年として「1980年」を特定し,「1980年」の人気名のリストを取得するための候補取得条件を生成した例を示している。この例の場合,候補取得条件に従って知識辞書Nから取得される「1980年」の人気名のリストに含まれる文字列が,置換文字列の候補となる。 【0029】 同じく,条件生成用文字列の属性が「生年月日」であり,修正対象文字列の属性が「名」である場合,生成部106は,例えば,条件生成用文字列を解析して生まれ年の干支を特定し,生まれ年の干支にちなんだ名前のリストを取得するといった候補取得条件を生成することもできる。図9の例では,生成部106が,「生年月日」属性の条件生成用文字列から生まれ年の干支として「辰」を特定し,「辰」にちなんだ名前のリストを取得する候補取得条件を生成した例を示している。この例の場合,候補取得条件に従って知識辞書Nから取得される「辰」にちなんだ名前のリストに含まれる文字列が,置換文字列の候補となる。 【0030】 同じく,条件生成用文字列の属性が「生年月日」であり,修正対象文字列の属性が「名」である場合,生成部106は,例えば,条件生成用文字列を解析して季節を特定し,季節にちなんだ名前のリストを取得するといった候補取得条件を生成することもできる。図9の例では,生成部106が,「生年月日」属性の条件生成用文字列から季節として「冬」を特定し,「冬」にちなんだ名前のリストを取得する候補取得条件を生成した例を示している。この例の場合,候補取得条件に従って知識辞書Nから取得される「冬」にちなんだ名前のリストに含まれる文字列が,置換文字列の候補となる。」 カ 「 」(【図9】) (3)当審の判断 (3-1)申立理由1について ア 本件特許発明1について (ア)対比 本件特許発明1と甲1発明とを対比する。 (ア-1)構成Aについて 構成i1の「保険証券」「記載位置」「どの位置にどのような情報が記載されるかがわかる(情報)」は構成Aの「証券」「証券上の位置」「文字が記載された複数のフィールドを特定する情報」に相当する。そして,これらの情報を含むフォーマットを特定するために,フォーマットに関する情報を格納するための格納部を備えることは自明のことである。 そうすると甲1発明の記載内容解析装置30は,構成Aの「証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部」に相当する構成を有しているといえる。 (ア-2)構成Bについて 構成c1の「画像(保険証券画像)を受信」することは構成Bの「証券の画像データを取得」することに相当し,構成e1の「枠線や罫線によって分割された領域(ブロック)」は,構成Bの「複数のフィールド」に相当する。 構成e1において文字情報抽出部33は,OCR技術を用いて保険証券画像から文字情報を抽出する際に,枠線や罫線によって分割された領域をそれぞれブロックとして取り扱うことができるから,当該ブロックに対応する画像を特定して文字情報を抽出することができるものである。 したがって,甲1発明と本件特許発明1とは,「証券の画像データを取得し,前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部」を備えている点で共通する。 しかしながら,フィールド特定部が前記複数のフィールドのそれぞれに対応する画像データを特定する際に,本件特許発明1では,「前記位置格納部を参照することにより」画像データを特定しているのに対して,甲1発明では,「前記位置格納部を参照することにより」画像データを特定することが明示的に記載されていない点で相違する。 (ア-3)構成Cについて 構成g1の「バリュー」は,保険証券の枠線や罫線によって分割された領域(ブロック)に含まれているものであるから,構成g1の「バリューの値の候補リスト」は構成Cの「前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書」に相当する。 したがって,甲1発明と本件特許発明1とは,「前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部」を備える点で共通する。 しかしながら,本件特許発明1の辞書は,「前記複数のフィールドを特定する情報のそれぞれに対応して」前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書であるのに対して,甲1発明の「バリューの値の候補リスト」は,保険証券の枠線や罫線によって分割された領域(ブロック)を特定する情報のそれぞれに対応してバリューの値の候補が登録されたものであるかどうかは不明である点で相違する。 (ア-4)構成Dについて 構成e1の「保険証券画像から文字情報を抽出する」ことは構成Dの「フィールドに記載されている文字列を」「推定する」ことに相当する。 構成e1の文字情報の抽出は「枠線や罫線によって分割された領域(ブロック)」の単位で行うことができるから,構成Dとは,「前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を」「推定する」点で共通する。 構成e1の文字情報の抽出に際しては,「バリューの値の候補リスト」(「前記辞書格納部に格納されている」「前記辞書」)を用いることができるから,上記の検討を踏まえると,構成e1の「文字情報抽出部33」と構成Dの「文字推定部」とは,「前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を,前記辞書格納部に格納されている前記辞書を用いて推定する文字推定部」の点で共通する。 しかしながら,本件特許発明1では,文字推定部が「学習機能」を用いると特定されているのに対して,甲1発明の構成k1では,学習をしてデータの抽出精度を高めることは特定されるものの,「文字情報抽出部33」が学習機能を用いることは特定されていない点で相違する。 また,本件特許発明1では,「前記辞書」が「前記フィールドを特定する情報に対応する」ものであるのに対して,甲1発明では,「バリューの値の候補リスト」が「ブロックを特定する情報に対応する」ことは特定されていない点で相違する。 (ア-5)構成Eについて 本件特許発明1は,「E 前記文字推定部は,前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を,学習機能を用いて推定する第1の推定部と,前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と,を含む」のに対して,甲1発明はそのような構成を備えていない点で相違する。 (ア-6)構成Fについて 甲1発明の「記載内容解析装置30」は,文字情報抽出部33がOCR技術を用いて保険証券画像から文字情報を抽出することができるものであるから,本件特許発明1の「文字認識装置」に相当する。 (ア-7)上記(ア-1)?(ア-6)より,本件特許発明1と甲1発明との一致点及び相違点は,次のとおりである。 [一致点] 「A 証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と, B’ 証券の画像データを取得し,前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と, C’ 前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と, D’ 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を,前記辞書格納部に格納されている前記辞書とを用いて推定する文字推定部と,を備えた F 文字認識装置。」 [相違点1] フィールド特定部が前記複数のフィールドのそれぞれに対応する画像データを特定する際に,本件特許発明1では,「前記位置格納部を参照することにより」画像データを特定しているのに対して,甲1発明では,「前記位置格納部を参照することにより」画像データを特定することが明示的に記載されていない点。 [相違点2] 本件特許発明1の辞書は,「前記複数のフィールドを特定する情報のそれぞれに対応し」たものであるのに対して,甲1発明の「バリューの値の候補リスト」は,ブロックを特定する情報に対応したものであるかどうかは不明である点。 [相違点3] 本件特許発明1では,文字推定部が「学習機能」を用いると特定されているのに対して,甲1発明の構成k1では,学習をしてデータの抽出精度を高めることは特定されるものの,「文字情報抽出部33」が学習機能を用いることは特定されていない点。 [相違点4] 本件特許発明1は,「E 前記文字推定部は,前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を,学習機能を用いて推定する第1の推定部と,前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と,を含む」のに対して,甲1発明はそのような構成を備えていない点。 (イ)相違点についての判断 事案に鑑みて,上記相違点4について先に検討すると,相違点4に係る本件特許発明1の「第2の推定部」は,「第1の推定部が推定した文字を含む文字列」と「辞書に登録されている単語」との「類似度」に基づいて文字列を推定しているところ,当該「類似度」は,「文字列」と「単語」との相互の類似の度合いを示す指標であり,具体的には,例えば明細書の段落0044に「当該辞書に文字数nの単語がある場合に(S107:Yes),第2の推定部180はここまでに推定したn番目までの文字列と,当該辞書の文字数nの単語との類似度を単語ごとに計算する(S111)(当審注:「S111」は,「S109」の誤記である。)。辞書の中に,類似度が閾値以上となる単語があった場合に(S111:Yes),第2の推定部180はその単語の文字データを,推定した文字列として顧客データベース70及び表示装置80の少なくとも一方に出力する(S113)。」と記載されているように,推定した文字列と,当該文字列と同じ文字数の単語とを比較することにより類似度を求めるものである。 これに対して,申立理由1(異議申立書の49?50頁)で類似度に関する技術が記載されているとされる甲第4号証には,上記(2-7)のとおりの記載がなされている。 特に,上記(2-7)の(エ)(オ)の記載によれば,甲第4号証に記載された技術は,手書き単語を認識する際に,文字の境目が曖昧で様々な読み方ができるため文字数の異なる多数の分割候補が生成されるところ,この多数の分割候補から正解を絞り込むために単語辞書を利用するものであり,多数の分割候補と単語辞書内の単語とを比較照合して,全組合せの中でもっとも照合スコアの高い組合せを単語認識結果とするというものであって,本件特許発明1のように,認識したn個の文字列と同じ文字数nの単語とを比較して類似度を計算するというものではないから,甲第4号証に記載された「照合スコア」は相違点4に係る「類似度」とは異なるものである。 したがって,文字認識した文字列と同数の文字数の単語を比較して類似度を計算することは,上記甲第4号証には記載されていないから,甲1発明及び甲第4号証に記載された技術的事項に基づいて,相違点4に係る構成を当業者が容易に想到し得たということはできない。 また,相違点4に係る「類似度」を計算することは,上記甲第2号証-1?甲第3号証,甲第5号証にも記載されておらず,また,本願出願前に当該技術分野における周知技術であったともいえない。 以上のとおりであるから,本件特許発明1は,相違点1?3について検討するまでもなく,当業者であっても,甲1発明及び甲第2号証-1?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 イ 本件特許発明2?6について 本件特許発明2?6は,本件特許発明1に対して,さらに技術的事項を追加したものであるから,本件特許発明1と同様の理由により,当業者であっても,甲1発明及び甲第2号証-1?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 ウ 本件特許発明8,9について 本件特許発明8は,本件特許発明1に対応する方法の発明であり,本件特許発明1の「前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部」に対応する構成を備えるものであるから,本件特許発明1と同様の理由により,当業者であっても,甲1発明及び甲第2号証-1?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 また,本件特許発明9は,本件特許発明1に対応するプログラムの発明であり,本件特許発明1の「前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部」に対応する構成を備えるものであるから,本件特許発明1と同様の理由により,当業者であっても,甲1発明及び甲第2号証-1?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 (3-2)申立理由2について ア 本件特許発明1について (ア)対比 本件特許発明1と甲2発明とを対比する。 (ア-1)構成Fについて 甲2発明は,手書き文字/活字文字認識対応の帳票OCRソフトウェアの発明であるところ,当該ソフトウェアをコンピュータで実行させた場合の装置は「手書き文字/活字文字認識対応の帳票OCR装置」であるといえるから,当該「装置」は本件特許発明1の「文字認識装置」に対応する。 (ア-2)構成Aについて 構成e2より,甲2発明は,「証券」の読み取りも対象としたものである。 構成d2より,甲2発明では,「帳票のフォーマット設定」がOCR読み取り領域と属性(読み取り文字種・桁数など)を指定するだけで可能であり,また,「読み取り領域(フィールド)」設定も簡単にできるものである。 そうすると,構成d2の「帳票のフォーマット設定」に設定される「複数のOCR読み取り領域の情報」は構成Aの「証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報」に相当し,当該「帳票のフォーマット設定」を記憶する「記憶部」は構成Aの「証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部」に相当するといえる。 (ア-3)構成Bについて 構成d2の読み取り領域(フィールド)を設定した「帳票のフォーマット設定」は,OCR読み取り領域を指定するものであるから,「証券(帳票)」をOCR読み取りする際には,「帳票のフォーマット設定」を参照することにより,「帳票のフォーマット設定」で指定されるOCR読み取り領域の画像データを特定してOCR読み取りを実行しているものと認められる。 そうすると,甲2発明は,構成Bの「証券の画像データを取得し,前記位置格納部を参照することにより,前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部」に相当する構成を備えているといえる。 (ア-4)構成Cについて 構成b2の「表記と読みの併用処理が可能で登録件数51,000件の姓名辞書」は,この辞書との照合を行うことで姓名の「読み取り領域(フィールド)」である「姓名フィールド」の文字の認識精度を向上させるものであり,また,「表記と読みの併用処理が可能な郵便番号辞書(住所辞書)」は,この辞書との照合を行うことで住所の「読み取り領域(フィールド)」である「住所フィールド」の文字の認識精度を向上させるものであるから,構成b2の「姓名辞書」及び「住所辞書」は,「複数のフィールド」のそれぞれに対応した「前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書」といえる。 また,上記(ア-2)より,構成d2の「帳票のフォーマット設定」に設定される「複数のOCR読み取り領域の情報」は構成Cの「複数のフィールドを特定する情報」に相当するものといえるから,構成b2の「姓名辞書」及び「住所辞書」は,「複数のOCR読み取り領域の情報」のそれぞれに対応したものといえる。 そうすると,構成b2の「表記と読みの併用処理が可能で登録件数51,000件の姓名辞書」,「表記と読みの併用処理が可能な郵便番号辞書(住所辞書)」は構成Cの「前記複数のフィールドを特定する情報のそれぞれに対応して,前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書」に相当し,前記「辞書」を記憶する「記憶部」は,構成Cの「辞書格納部」に相当する。 (ア-5)構成Dについて 上記(ア-3)の検討によれば,「証券(帳票)」をOCR読み取りする際には,「帳票のフォーマット設定」で指定されるOCR読み取り領域(フィールド)の画像データを特定してOCR読み取りを実行しているものと認められ,また,上記(ア-4)の検討によれば,構成d2の「OCR読み取り領域(フィールド)」は,当該領域(フィールド)毎に,当該領域(フィールド)に対応した「辞書」を用いて「OCR読み取り」が実行されるものと認められるから,甲2発明は構成Dに対応する「前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書を用いて推定する文字推定部」を備えているということができる。 また,構成c2によれば,甲2発明のソフトウェアは,活字・印字文字の特殊字体(フォント)や手書きの癖字など,文字をその場で登録(学習)させることで認識精度を向上させることができる学習機能を備えたものである。 してみれば,甲2発明と本件特許発明1とは,構成Dを備えている点で一致する。 (ア-6)構成Eについて 本件特許発明1は,「E 前記文字推定部は,前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を,学習機能を用いて推定する第1の推定部と,前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と,を含む」のに対して,甲2発明はそのような構成を備えていない点で相違する。 (ア-7)上記(ア-1)?(ア-6)より,本件特許発明1と甲2発明との一致点及び相違点は,次のとおりである。 [一致点] 「A 証券上の位置に対応付けて,文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と, B 証券の画像データを取得し,前記位置格納部を参照することにより,前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と, C 前記複数のフィールドを特定する情報のそれぞれに対応して,前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と, D 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて,フィールドに記載されている文字列を,学習機能と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と,を備えた F 文字認識装置。」 [相違点5] 本件特許発明1は,「E 前記文字推定部は,前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を,学習機能を用いて推定する第1の推定部と,前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と,を含む」のに対して,甲2発明はそのような構成を備えていない点。 (イ)相違点についての判断 上記相違点5は,上記(3-1)ア(イ)で判断した相違点4と同じであるから,上記(3-1)ア(イ)の判断と同様である。 したがって,本件特許発明1は,当業者であっても,甲2発明及び甲第1号証,甲第2号証-2?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 イ 本件特許発明2?6について 本件特許発明2?6は,本件特許発明1に対して,さらに技術的事項を追加したものであるから,本件特許発明1と同様の理由により,当業者であっても,甲2発明及び甲第1号証,甲第2号証-2?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 ウ 本件特許発明8,9について 本件特許発明8は,本件特許発明1に対応する方法の発明であり,本件特許発明1の「前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部」に対応する構成を備えるものであるから,本件特許発明1と同様の理由により,当業者であっても,甲2発明及び甲第1号証,甲第2号証-2?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 また,本件特許発明9は,本件特許発明1に対応するプログラムの発明であり,本件特許発明1の「前記第1の推定部が推定した文字を含む文字列と,前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部」に対応する構成を備えるものであるから,本件特許発明1と同様の理由により,当業者であっても,甲2発明及び甲第1号証,甲第2号証-2?甲第5号証に記載された技術的事項に基づいて容易に発明できたものであるとはいえない。 6 むすび 以上のとおり,本件特許の請求項1?6,8,9に係る特許は特許異議申立書に記載した申立ての理由によっては,取り消すことはできない。 また,他に本件特許の請求項1?6,8,9に係る特許を取り消すべき理由を発見しない。 また,本件特許の請求項7に係る特許は,上記のとおり,訂正により削除された。これにより,特許異議申立人による特許異議の申立てのうち,請求項7に係る申立ては,申立ての対象が存在しないものとなったため,特許法第120条の8第1項で準用する同法第135条の規定により却下する。 よって,結論のとおり決定する。 |
発明の名称 |
(57)【特許請求の範囲】 【請求項1】 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、 証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、 前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と、 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と を備え、前記文字推定部は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定部と、前記第1の推定部が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と、を含む、文字認識装置。 【請求項2】 前記複数のフィールドのいずれかは住所のフィールドであり、 前記住所のフィールドに対応する前記辞書には、都道府県名、市区町村名および地域名の可能な組み合わせが階層化されて登録されており、 前記文字推定部は、都道府県名、市区町村名および地域名ごとに前記文字列を推定する請求項1に記載の文字認識装置。 【請求項3】 前記住所のフィールドに対応する前記辞書には、行政上の変更があった都道府県名、市区町村名および地域名について、旧名称と現名称とが対応付けられて登録されており、 前記文字推定部は、推定した文字列が前記旧名称である場合には前記旧名称に対応付けられている前記現名称を少なくとも出力する請求項2に記載の文字認識装置。 【請求項4】 前記複数のフィールドのいずれかは年を含むフィールドであり、 前記年を含むフィールドに対応する前記辞書には、西暦と元号とが対応付けられて登録されており、 前記文字推定部は、推定した文字列が前記元号である場合には前記元号に対応付けられている前記西暦による年を少なくとも出力する請求項1から3のいずれか1項に記載の文字認識装置。 【請求項5】 前記複数のフィールドのいずれかは年を含むフィールドであり、他のいずれかは前記年に関連する内容を含むフィールドであり、 前記年に関連する内容を含むフィールドに対応する前記辞書には、前記年および前記内容の組み合わせが登録されており、 前記文字推定部は、前記年を含むフィールドで推定した前記年を用いて、前記年に関連する内容を含むフィールドに対応する前記辞書を参照する請求項1から4のいずれか1項に記載の文字認識装置。 【請求項6】 前記年を含むフィールドは車検の初度登録の日付のフィールドであり、前記年に関連する内容を含むフィールドは車の型式のフィールドである請求項5に記載の文字認識装置。 【請求項7】(削除) 【請求項8】 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、 前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されており、 証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定段階と、 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定段階と を備える、前記文字推定段階は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定段階と、前記第1の推定段階で推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定段階と、を含む、文字認識方法。 【請求項9】 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、 前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されている、 コンピュータに 証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定手順、および、 前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定手順を実行させ、前記文字推定手順は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定手順と、前記第1の推定手順が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定手順と、を含む、プログラム。 |
訂正の要旨 |
審決(決定)の【理由】欄参照。 |
異議決定日 | 2020-07-31 |
出願番号 | 特願2018-65339(P2018-65339) |
審決分類 |
P
1
651・
121-
YAA
(G06K)
|
最終処分 | 維持 |
前審関与審査官 | 笠田 和宏、川▲崎▼ 博章 |
特許庁審判長 |
千葉 輝久 |
特許庁審判官 |
須田 勝巳 間宮 嘉誉 |
登録日 | 2019-07-05 |
登録番号 | 特許第6550163号(P6550163) |
権利者 | Arithmer株式会社 三井住友海上火災保険株式会社 |
発明の名称 | 文字認識装置、文字認識方法およびプログラム |
代理人 | 龍華国際特許業務法人 |
代理人 | 龍華国際特許業務法人 |
代理人 | 龍華国際特許業務法人 |