拒絶査定不服の審決｜不服2010-24552 - 特許審決データベース

会員機能

ランキング

請求人別審判件数

判例データベース

審決データベース

ポートフォリオ機能

ポートフォリオを新規に作成して保存		追加
既存のポートフォリオに追加保存		追加

この審決の個人情報、企業機密に関する修正依頼をする

PDF	PDFをダウンロード

審決分類	審判査定不服 2項進歩性特許、登録しない。 G10L 審判査定不服 5項独立特許用件特許、登録しない。 G10L 審判査定不服 4号2号請求項の限定的減縮特許、登録しない。 G10L
管理番号	1259471
審判番号	不服2010-24552
総通号数	152
発行国	日本国特許庁(JP)
公報種別	特許審決公報
発行日	2012-08-31
種別	拒絶査定不服の審決
審判請求日	2010-11-01
確定日	2012-07-04
事件の表示	特願2004-544575「ディレクトリアシスタント方法及び装置」拒絶査定不服審判事件〔平成16年 4月29日国際公開、WO2004/036887、平成18年 1月26日国内公表、特表2006-503328〕について、次のとおり審決する。
結論	本件審判の請求は、成り立たない。
理由	第1.手続の経緯本願は、平成15年10月8日の国際出願(パリ条約による優先権主張 2002年(平成14年)10月16日欧州特許庁)であって、平成21年11月24日付けの拒絶理由の通知に対し、平成22年5月31日付けで手続補正がなされたが、平成22年6月17日付けで拒絶査定がなされた。これに対し、平成22年11月1日に審判請求がなされるとともに、同日付けで手続補正がなされた。第2.平成22年11月1日付けの手続補正についての補正却下の決定 [補正却下の決定の結論] 平成22年11月1日付けの手続補正を却下する。 [理由] 1.補正の内容この補正により、特許請求の範囲の請求項12は次のように補正された。「所望のディレクトリエントリ情報を提供するディレクトリアシスタント装置において、前記装置が、ディレクトリエントリ情報、語及び語の説明の仕方を記憶するデータベースと、前記所望のディレクトリエントリを説明する音声信号を受信し、前記音声信号を認識し、認識された語系列を生成する音響認識ユニットと、前記データベースから、前記認識された語系列が意味する語の説明の仕方を検索し、見つけられた前記語の説明の仕方に対応する語からなる前記所望のディレクトリエントリに対する少なくとも1つの候補を生成する音声解釈ユニットと、前記データベースから前記少なくとも1つの候補に対応する少なくとも1つのディレクトリエントリ情報を検索するルックアップユニットと、見つけられた前記少なくとも1つのディレクトリエントリ情報を出力する出力ユニットと、を有し、前記語の説明の仕方が、語のストロークを含む、ディレクトリアシスタント装置。」 2.補正の適否上記の補正は、「語の説明の仕方が、語のストローク又は語根を含む」ものであったのを「語の説明の仕方が、語のストロークを含む」と補正して選択肢の1つを削除することにより、語の説明の仕方を限定するものであるから、補正前の請求項12に記載された発明を特定するために必要な事項を限定するものである。したがって、この補正は、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法(以下、「平成18年改正前特許法」という)第17条の2第4項第2号に規定された特許請求の範囲の減縮を目的とするものである。そこで、補正後の請求項12に係る発明(以下、「本願補正発明」という)が特許出願の際独立して特許を受けることができるものであるか否か(平成18年改正前特許法第17条の2第5項において準用する同法第126条第5項の規定に違反するか否か)について以下に検討する。 (1)本願補正発明本願補正発明は、上記1.補正の内容に記載した請求項12に記載された事項により特定されるとおりのものである。 (2)刊行物の記載事項これに対して、原査定の拒絶の理由で引用された本願の優先権主張の日前に頒布された刊行物である特開2002-287787号公報(以下、「刊行物1」という)には、図面とともに、次のア?エの事項が記載されている。ア.「【0001】【発明の属する技術分野】本発明は言語モデリングに関する。さらに詳細には、入力された音声を文字認識する際などに不明確さを最小限にするための言語モデルの作成および使用に関する。【0002】【従来の技術】音声(speech)を正確に認識するには、ユーザが発声した正しいワードを選択するために、単なる音響モデル以上のものが必要である。すなわち、どのワードが発声されたかを音声認識装置によって選択または判定しなければならない場合、すべてのワードの発声される可能性が同じなら、音声認識装置は典型的には十分な機能を果たさないことになる。言語モデルは、語彙中のどのワードシーケンスが起こり得るかを指定する方法または手段を提供するか、または一般に、様々なワードシーケンスの可能性に関する情報を提供する。」イ.「【0005】不明確さの問題は、特に、漢字体系で書かれることが多い日本語や中国語などの言語に関連している。これらの言語の文字は、サウンドと意味とを表す多くの複雑な表意文字である。限られた音節を形成する文字が、今度は、ディクテーションによって文書を作成するのに必要な時間をかなり長引かせる多くの同音異義語を作り出す。具体的に言えば、文書中で間違った同音異義文字を識別し、次いで正しい同音異義文字を挿入しなければならない。【0006】【発明が解決しようとする課題】したがって、異なる意味を持ちサウンドが似ている音声が発声されるときに不明確さを最小限にするための新しい方法を継続的に開発していく必要がある。技術が進歩し、より多くの適用分野で音声認識が実現されていくにしたがって、より正確な言語モデルが入手可能でなければならない。【0007】【課題を解決するための手段】音声認識装置は一般に、正確さを向上させるN-gｒam言語モデルなどの言語モデルを使用する。本発明の第一の態様は、ワードの綴りを言うときなどに、話し手が一つまたはいくつかの文字(例えば音節)を識別する際に特に役立つ、言語モデルの生成を含む。言語モデルは、同音異義語を明確化する場合、および異なる文字が互いに類似のサウンドである場合に助けとなる。言語モデルは、文字列(単一の文字の場合もある)、文字列を有する語句(単一の語の場合もある)、および文脈キュー(a context cue)という関連する要素を含むトレーニングコーパス(training corpus)から構築される。トレーニングコーパスは、ワードのリストまたは辞書を使用し、語句、文脈キュー、および語句の文字列を含むそれぞれの語句について、部分的な文(a partial sentence)または句を形成することによって自動的に生成することができる。他の実施形態では、語句のそれぞれの文字について句が作成される。【0008】本発明の他の態様は、発声された文字を認識する際に前述の言語モデルを使用するシステムまたはモジュールである。関連付けられた語句における文脈キューに関連して文字列が発声されると、音声認識モジュールは、ユーザが綴りを言っているか、またはそうでなければ文字を識別していることを確認する。次いで音声認識モジュールは、識別された文字だけを出力し、文脈キューまたは関連付けられた語句は出力しない。他の実施形態では、音声認識モジュールは、認識された文字と認識された語句とを比較して正しい文字が識別されたことを検証する。認識された文字が認識された語句の中にない場合、出力される文字は認識された語句の文字となる。【0009】【発明の実施の形態】図1は、言語入力12を受け取り、言語入力12を処理して言語出力14を提供する言語処理システム10の概略を示す図である。例えば、言語処理システム10は、ユーザによって発声されたかまたは記録された言語を言語入力12として受け取る音声認識システムまたはモジュール(a speech recognition system or module)として実施することができる。言語処理システム10は発声された言語を処理し、出力として、典型的にはテキスト出力形式の認識されたワードおよび/または文字として提供する。【0010】処理中に音声認識システムまたはモジュール10は、どのワードが、および具体的に言えば言語のどの同音異義語または他の類似のサウンドの要素が発声されたのかを判定するため、言語モデル16にアクセスすることができる。言語モデル16は、英語、中国語、日本語などの特定の言語を符号化する。図示された実施形態では、言語モデル16は、N-gｒam言語モデルなどの統計的言語モデル、文脈自由文法(context-free-grammar)、または同様の混成であってよく、それらはすべて当技術分野においてよく知られている。本発明の幅広い態様の一つが、言語モデル16を作成または構築する方法である。他の幅広い態様は、同様のものを音声認識において使用することである。」ウ.「【0027】ツリー検索エンジン114は、語彙目録記憶モジュール110にストアされた語彙目録(lexicon)にもアクセスする。音響モデル112へのアクセスに基づいてツリー検索エンジン114が受け取った情報は、語彙目録記憶モジュール110をサーチして特徴抽出モジュール106から受け取った符号語または特徴ベクトルを最もよく表すワードを決定する際に使用される。また、ツリー検索エンジン114は、言語モデル16と111にもアクセスする。一実施形態において、言語モデル16は入力音声によって最もよく表される文字を識別する際に使用されるワードN-gｒamであり、これは、文字、文脈キュー、および文字を識別するための語句(a word phrase)を含んでいる。例えば、入力音声が「N aｓ in Nancｙ」である場合、ここで「N」(小文字の場合もある)が所望の文字であり、「aｓ in」は文脈キュー、「Nancｙ」は所望の文字を明らかにするかまたは識別するように文字「N」に関連付けられた語句である。「N aｓ in Nancｙ」という句に関して、音声認識システム100の出力は文字「N」だけとなる可能性がある。言い換えれば、音声認識システム100は「N aｓ in Nancｙ」の句に関する入力音声データを分析する際に、ユーザが文字の綴りを言うことを選択したことを確認する。したがって、文脈キューおよび関連付けられた語句が出力テキストから省略される。ツリー検索エンジン114は、必要であれば文脈キューおよび関連付けられた語句を除去することができる。」エ.「【0036】本発明の第1の幅広い態様が、文字を示すための言語処理システム用に言語モデルを作成する方法140として図4に示されている。図5も参照すると、システムまたは装置142は、方法140を実施するための命令を備えたモジュールを含む。一般に方法140は、ステップ144において、語句リストのそれぞれの語句について、語句の文字列および語句を文字列の識別を示す文脈キューに関連付けることを含む。文字列には単一の文字を含めることができることに留意されたい。同様に、語句には単一の語句を含めることができる。例えば、1文字に等しい文字列および1ワードに等しい語句の場合、ステップ144では、ワードリスト141にあるそれぞれのワードについて、ワードの文字を文脈キューに関連付ける。文脈キューとは、一般に、語句内の言語要素を識別するために話し手が使用する特定言語のワードまたは語句である。英語の文脈キューの例として、「aｓ in」、「fｏｒ eｘamｐle」、「aｓ fｏｕnd in」、「like」、「ｓｕch aｓ」などを含む。他の言語についても、日本語の「の」および中国語の「的」など、類似のワードまたは語句が見られる。一実施形態では、ステップ144は、語句のコーパス143を構築することを含む。それぞれの語句は、文字列、語句、および文脈キューを含む。単一の文字がワードに関連付けられている場合、典型的には、そのワードの他の文字も使用可能であるが、最初の文字が使用される。こうした語句の例は、「N aｓ in Nancｙ」、「P aｓ in Paｕl」、および「Z aｓ in ｚebｒa」を含む。【0037】他の実施形態では、ワードの他の文字がワードおよび文脈キューに関連付けられており、さらに、1文字、2文字、または3文字しか含まないワードが多い中国語などの一部の言語では、ワードの各文字を文脈キュー中のワードに関連付けることが有用な場合がある。前述のように、所望の文字を対応するワードおよび文脈キューに関連付けるための簡単な方法は、同じ語句を形成することである。したがって、ワードリスト141が与えられると、言語モデルをトレーニングするための語句のコーパス143を、すべての所望の文脈キューについて容易に生成することができる。」以上の記載から、刊行物1には以下の発明(以下、「刊行物1発明」という)が記載されている。同音異義語を明確化する場合、および異なる文字が互いに類似のサウンドである場合に助けとなるものであり、文字(例えば、「N」)、文脈キュー(例えば、「aｓ in」)、および文字を識別するための語句(例えば、「Nancｙ」)を含んだ言語モデルと、入力音声データ(例えば、「N aｓ in Nancｙ」)を、音響モデル、語彙目録記憶モジュール、前記言語モデル、へのアクセスに基づいて分析して、ワード、文字、文脈キュー、および文字を識別するための語句を確認し、文脈キューおよび関連付けられた語句(例えば、「aｓ in」、「Nancｙ」)が出力テキストから省略されて、認識したテキストを出力する、ツリー検索エンジンと、を有し、日本語や中国語などの言語についても、文脈キュー(例えば、「の」、「的」)、および文字を識別するための語句を用いて音声を認識する音声認識システム。 (3)刊行物1との対比・判断本願補正発明と刊行物1発明とを対比する。刊行物1発明の「言語モデル」は、コンピュータのメモリに記憶されているものであるから、本願補正発明の「データベース」に対応付けられるものである。その記憶内容である「文字」は、本願補正発明の「語」に、「文脈キュー、および文字を識別するための語句(関連付けられた語句)」は、例えば、英語の「aｓ in」や「Nancｙ」、日本語の「の」、中国語の「的」などの同音異義語を明確化する場合、および異なる文字が互いに類似のサウンドである場合に助けとなるものであるから、「語の説明の仕方」に相当する。したがって、本願補正発明と刊行物1発明とは、「語及び語の説明の仕方を記憶するデータベース」を有する点で共通する。刊行物1発明の入力音声データは、「文脈キュー、および文字を識別するための語句」を含んでおり、これらは出力テキストを説明するためのものである。また、本願補正発明の「ディレクトリエントリ」は、実施例では、名前、電話番号などを有するものであり、「所望のディレクトリエントリを説明する音声信号」は、音声により名前の文字を説明するためのものを含んでいる。よって、刊行物1発明の入力音声データは、本願補正発明の「所望のディレクトリエントリを説明する音声信号」に相当するといえる。また、刊行物1発明のツリー検索エンジンは、入力音声データを分析して認識したテキストを出力するものであるから、本願補正発明の「所望のディレクトリエントリを説明する音声信号を受信し、前記音声信号を認識し、認識された語系列を生成する音響認識ユニット」に相当する。さらに、刊行物1発明のツリー検索エンジンは、入力音声データを、言語モデル、へのアクセスに基づいて分析して、文脈キュー、および文字を識別するための語句を確認し、文脈キューおよび関連付けられた語句が出力テキストから省略されて、認識(解釈)したテキストを出力するものであり、出力されるテキストは音声認識された確率の高い候補といえるから、本願補正発明の「前記データベースから、前記認識された語系列が意味する語の説明の仕方を検索し、見つけられた前記語の説明の仕方に対応する語からなる前記所望のディレクトリエントリに対する少なくとも1つの候補を生成する音声解釈ユニット」にも相当するといえる。したがって、本願補正発明と刊行物1発明とは、「所望のディレクトリエントリを説明する音声信号を受信し、前記音声信号を認識し、認識された語系列を生成する音響認識ユニットと、前記データベースから、前記認識された語系列が意味する語の説明の仕方を検索し、見つけられた前記語の説明の仕方に対応する語からなる前記所望のディレクトリエントリに対する少なくとも1つの候補を生成する音声解釈ユニットと、」を有する点で一致する。以上をまとめると、本願補正発明と刊行物1発明の一致点及び相違点は次のとおりである。 [一致点] 語及び語の説明の仕方を記憶するデータベースと、所望のディレクトリエントリを説明する音声信号を受信し、前記音声信号を認識し、認識された語系列を生成する音響認識ユニットと、前記データベースから、前記認識された語系列が意味する語の説明の仕方を検索し、見つけられた前記語の説明の仕方に対応する語からなる前記所望のディレクトリエントリに対する少なくとも1つの候補を生成する音声解釈ユニットと、を有する、装置。 [相違点1] 本願補正発明は、音声を認識した結果をディレクトリアシスタント(顧客への電話番号の提供等)に用いる、「所望のディレクトリエントリ情報を提供するディレクトリアシスタント装置」であって、「ディレクトリエントリ情報」を記憶した「前記データベースから前記少なくとも1つの候補に対応する少なくとも1つのディレクトリエントリ情報を検索するルックアップユニットと、見つけられた前記少なくとも1つのディレクトリエントリ情報を出力する出力ユニットと、」を有するものであるのに対し、刊行物1発明は、音声認識装置ではあるが、音声を認識した結果を用いる用途については特定されていない点。 [相違点2] 本願補正発明では、「語の説明の仕方が、語のストロークを含む」のに対し、刊行物1発明では、「文脈キュー、および文字を識別するための語句」(本願補正発明の「語の説明の仕方」に相当)は、語のストロークを含むとはされていない点。これらの相違点について検討する。 [相違点1]について音声認識装置を使用して、ディレクトリエントリ情報を記憶したデータベースから少なくとも1つの候補に対応する少なくとも1つのディレクトリエントリ情報を検索するルックアップユニットと、見つけられた前記少なくとも1つのディレクトリエントリ情報を出力する出力ユニットとを有する、所望のディレクトリエントリ情報を提供するディレクトリアシスタント装置は、平成21年11月24日付けの拒絶理由通知で引用した「A. Kellner et al.,"PADIS-An Automatic Telephone Switchboard and Directory Information System",Speech Communication,1997年10月,Vol.23,p.95-111」や本願明細書の背景技術にも記載されているように、当業者によく知られた周知のものである。また、刊行物1発明の音声認識システムは、その用途は特定されていないが、音声認識装置を使用する様々な周知の用途に用いるものであることは明らかであるから、刊行物1発明の音声認識システムを、単に周知のディレクトリアシスタント装置として用いることに格別の困難があるわけではないし、そのこと自体による格別の効果もない。 [相違点2]について刊行物1発明は、英語だけでなく日本語や中国語などの漢字を含む言語についても、文脈キュー、および文字を識別するための語句(本願補正発明の「語の説明の仕方」に相当)を用いて音声を認識(解釈)するものである。また、漢字の説明の仕方として、「語のストローク」を用いることは、例えば、「川」を「縦三本の川」、「大」を「よこぼうで左にはらって右ばらい」、「頭」を「いちくちソいちいちノ目ハ」などと説明するように、通常よく行われていることであって、一般的に周知慣用のことであるといえる。特に、日本国においては、そのような説明は「字書き歌」としても種々の文字のものが知られている。したがって、刊行物1発明において、漢字の説明の仕方として語のストロークを用いることは、当業者が容易に想到し得ることである。以上のとおり、本願補正発明は、刊行物1発明及び周知技術に基づいて、当業者が容易に発明をすることができたものであり、特許法第29条第2項の規定により特許出願の際独立して特許を受けることができないものである。よって、本件補正は、平成18年改正前特許法第17条の2第5項において準用する同法第126条第5項の規定に違反してなされたものであるから、同法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。第3.本願発明について 1.本願発明平成22年11月1日付けの手続補正は上記のとおり却下されたので、本願の請求項に係る発明は、平成22年5月31日付け手続補正書の特許請求の範囲の請求項1ないし22に記載された事項により特定されるものであるところ、その請求項12に係る発明(以下、「本願発明」という)は、次のとおりのものである。「所望のディレクトリエントリ情報を提供するディレクトリアシスタント装置において、前記装置が、ディレクトリエントリ情報、語及び語の説明の仕方を記憶するデータベースと、前記所望のディレクトリエントリを説明する音声信号を受信し、前記音声信号を認識し、認識された語系列を生成する音響認識ユニットと、前記データベースから、前記認識された語系列が意味する語の説明の仕方を検索し、見つけられた前記語の説明の仕方に対応する語からなる前記所望のディレクトリエントリに対する少なくとも1つの候補を生成する音声解釈ユニットと、前記データベースから前記少なくとも1つの候補に対応する少なくとも1つのディレクトリエントリ情報を検索するルックアップユニットと、見つけられた前記少なくとも1つのディレクトリエントリ情報を出力する出力ユニットと、を有し、前記語の説明の仕方が、語のストローク又は語根を含む、ディレクトリアシスタント装置。」 2.刊行物原査定の拒絶の理由で引用された刊行物、及び、その記載事項は、前記第2.2.(2)に記載したとおりである。 3.対比・判断本願発明は、前記第2.2.で検討した本願補正発明における「語の説明の仕方」の選択肢として「語根」を追加して拡張したものであるから、本願発明は本願補正発明を含みさらに拡張したものである。そうすると、本願発明に含まれる本願補正発明が前記第2.2.に記載したとおり、刊行物1に記載された発明及び周知技術に基づいて、当業者が容易に発明をすることができたものであるから、本願発明も、同様の理由により、刊行物1に記載された発明及び周知技術に基づいて当業者が容易に発明をすることができたものである。第4.むすび以上のとおりであるから、本願の請求項12に係る発明は、特許法第29条第2項の規定により特許を受けることができない。したがって、本願は、その余の請求項について論及するまでもなく、拒絶すべきものである。よって、結論のとおり審決する。
審理終結日	2012-02-06
結審通知日	2012-02-07
審決日	2012-02-21
出願番号	特願2004-544575(P2004-544575)
審決分類	P 1 8・ 572- Z (G10L) P 1 8・ 575- Z (G10L) P 1 8・ 121- Z (G10L)
最終処分	不成立
前審関与審査官	菊池智紀
特許庁審判長	板橋通孝
特許庁審判官	千葉輝久古川哲也
発明の名称	ディレクトリアシスタント方法及び装置
代理人	笛田秀仙
代理人	津軽進

プライバシーポリシーセキュリティーポリシー運営会社概要サービスに関しての問い合わせ