• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない。 G10L
管理番号 1305522
審判番号 不服2014-11940  
総通号数 191 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2015-11-27 
種別 拒絶査定不服の審決 
審判請求日 2014-06-24 
確定日 2015-09-08 
事件の表示 特願2009-516739「音声認識方法」拒絶査定不服審判事件〔平成19年12月27日国際公開、WO2007/150006、平成21年11月26日国内公表、特表2009-541800〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 1.手続の経緯
本願は、平成19年6月21日(パリ条約に基づく優先権主張外国庁受理 平成18年6月22日 米国(US))を国際出願日とする特許出願であって、平成24年3月19日付け拒絶理由通知に対する応答時、同年9月21日付けで手続補正がなされ、平成25年2月27日付け最後の拒絶理由通知に対する応答時、同年7月26日付けで手続補正及び誤訳訂正がなされ、さらに同年10月4日付け拒絶理由通知に対する応答時、平成26年1月10日付けで手続補正がなされたが、同年2月18日付けで拒絶査定がなされ、これに対して、同年6月24日付けで拒絶査定不服審判の請求がなされたものである。

2.本願発明
本願の請求項1ないし6に係る発明は、平成26年1月10日付け手続補正書により補正された特許請求の範囲の請求項1ないし6に記載された事項により特定されるとおりのものと認められるところ、請求項6に係る発明(以下、「本願発明」という。)は、次のとおりである。
「【請求項6】
発話が音声認識され、転写されて得られた第1の筆記録の第1の部分の第1の語義的意味をエンコードするための第1の意味エンコード手段と、
前記第1の語義的意味に基づいて、前記筆記録の前記第1の部分に、優先度の高い第1のサービスレベルを割り当てるための第1のサービスレベル割り当て手段と、
前記第1の筆記録の第2の部分の第2の語義的意味をエンコードするための第2の意味エンコード手段と、
前記第2の語義的意味に基づいて、前記筆記録の前記第2の部分に、優先度の低い第2のサービスレベルを割り当てるための第2のサービスレベル割り当て手段と、
前記第1および第2のサービスレベルに応じて前記筆記録を検証するための検証手段と、
を備え、
前記検証手段は、第1の時間に前記第1の部分を検証するための手段と、
前記第1の時間より後であって、ユーザーに前記筆記録を使用させた後である第2の時間に前記第2の部分を検証するための手段と、を備え、
前記第1のサービスレベル割り当て手段は、
前記第1の部分が人間による検証を必要とするかどうかを決定するための手段と、
前記第1の部分が人間による検証を必要とするかどうかに基づいて、前記第1の部分に前記第1のサービスレベルを割り当てるための手段と、を含む装置。」

3.引用例
(3-1)引用例1
これに対して、原査定の拒絶の理由に引用された特開平9-106428号公報(以下、「引用例1」という。)には、「所見作成装置」について、図面とともに以下の各記載がある(なお、下線は当審で付与した)。
ア.「【請求項1】 所見内容を音声で入力する入力手段と、
当該入力された音声を認識する音声認識手段と、
該音声認識手段の認識結果を文書処理して所見報告書を作成する文書処理手段とを具えたことを特徴とする所見作成装置。
【請求項2】 前記入力手段から入力された音声の意味内容を判別する判別手段をさらに具えたことを特徴とする請求項1に記載の所見作成装置。
【請求項3】 前記意味内容の種類を示す属性情報、単語および音声パターンを関連付けて記載した用語辞書を有し、前記音声認識手段は前記入力手段から入力された音声の音声パターンと類似する音声パターンに対応の単語を抽出することにより音声認識し、前記判別手段は当該音声パターンに対応の属性を抽出することにより意味内容を判別することを特徴とする請求項2に記載の所見作成装置。」

イ.「【0027】図1は本発明を適用した所見作成装置および所見作成装置が作成した所見を保存、検索する所見データベースシステムを示す。図1において、所見作成装置10には、ユーザが音声で所見を入力するためのヘッドホン1が接続されている。ヘッドホン1はマイク1Aおよびスピーカ1Bを有する。所見作成装置10には、さらに、所見作成装置10により作成された所見を目視確認するための表示装置2および作成の所見に対する修正情報、所見作成に関わる動作指示を入力するキーボード3および表示装置2の表示位置を指示するマウス4が接続されている。
【0028】所見作成装置10は、以下の構成部がバスに共通接続されている。CPU11は装置全体のシステム制御を実行する他、ハードディスク16に格納された所見作成プログラムにより所見を作成する。また、CPU11がハードディスク16上の登録、検索プログラムを実行することにより作成された所見をサーバ30上の所見データベースに登録し、必要に応じてサーバ30の所見データベースを検索し、所望の所見を取得することも可能である。
【0029】音声認識合成装置12はマイク1Aから入力された音声を音声認識し、単語単位の文字コードに変更すると共に、文字コードを音声に変換する。この際、本発明に関わる属性も得られる。スピーカ1Bには音声信号を出力する衆知のものを使用できる。メモリはROMおよびRAMから構成され、システム制御のためのシステムプログラムやCPU11の演算に用いるデータ、表示装置2に表示するイメージデータを記憶する。
【0031】本実施例は、所見を音声で入力することに加えて、この用語辞書16Aを用いて音声の中から重要キーワードを抽出し、そのリストを作成することに特徴がある。」

ウ.「【0033】このようなシステム構成において実行される所見作成処理の流れを図4を用いて説明する。ユーザはヘッドホン1を装着し、X線写真そのものあるいは表示装置2に表示されたX線写真イメージを見て、マイク1Aに対して音声で所見内容を入力する(P1→P2)。音声認識合成装置12は入力された音声から特徴音声パターンを抽出し、ハードディスク16上の用語辞書16Aの中の一致する特徴音声パターンを検出する。これにより、入力音声が単語(句を含む)単位の文字列が得られる(P4)。この文字列は音声認識合成装置12により音声合成され、スピーカ1Bに再生出力される(P7)。音声認識合成装置12により得られた文字列すなわち、認識単語および属性はオペレーションシステム(OS)を介して所見作成プログラム31に渡される。キーボード3から入力される情報もオペレーションシステム(OS)を介して所見作成プログラムに引渡される。
【0034】キーボード3から入力された動作指示に応じて、CPU11は後述の各種情報処理を実行する。また、上記認識単語を表示装置2の表示画面に表示させると共に、認識単語の示す属性が、所見リスト作成に用いる属性である場合には、より具体的にはCPU11は属性が上記特定の属性に合致するかを判別し、肯定判定が得られたときに、この属性を示す単語文字列コードあるいはその識別コードを図3に示すようにリストアップする。本例の場合、X線写真を写した患者のID(識別番号)をキーボード3あるいは音声で与え、ID毎に、所見の内容の示す単語、たとえば臓器名、部位、所見(症状)等の属性を持つ単語を文字コードの形態でハードディスク16上に記憶する(P11→P14)。このようにしてリストアップされた単語はデータベースに登録する際のキーワードや要約として用いることもできるし、患者の病状を示すカルテとしても使用できる。
【0035】認識単語は音声から入力される毎に得られるので、認識単語を集積してテキスト文書としてハードディスク16上に記憶する(P12)。・・・・・(以下、略)」

エ.「【0036】CPU11の処理を図5?図6を用いてより詳細に説明する。所見作成装置の電源を投入すると、ハードディスク16上の図5の所見作成プログラムが起動され、表示装置2の表示画面にメニュー画面が表示される(ステップS10)。本実施例には以下の処理メニューが用意されている。
【0037】1)所見作成処理:音声入力した所見を表示し、テキスト文書としてハードディスク16へ記憶させる処理
2)報告書作成処理:テキスト文書を帳票の形態に文書編集し、印刷する処理
3)データベース登録処理:作成したテキスト文書を所見データベースに登録する処理
4)その他処理:所見データベースの検索処理、所見リストの印刷処理等
ユーザはマウス4により所見作成処理を選択すると、手順はステップS20→S30→S100の経路でステップS100の所見作成処理へ移行する。この所見作成処理の詳細を図6に示す。
【0038】CPU11は音声認識合成装置12を作動させ、ユーザの音声入力を受付ける(ステップS101)。音声認識記憶装置12から認識単語およびこの認識単語に対応する意味属性を取得する(ステップS102)。認識単語についての音声の再生を音声認識合成装置12に指示し、スピーカ1Bから再生音声を出力する(ステップS103)。
【0039】認識単語をメモリ13上のテキスト文書の指示位置(マウス等の指示による)に挿入し、認識単語を挿入した後のテキスト文書を表示装置2の表示画面に表示させる。属性についてはメモリ13上のリストのレコードの該当する箇所(図3参照)に単語を示す文字列コードを記憶する(ステップS104)。属性が“程度”の場合には程度を示す数値や記号を記憶する。
【0040】以下、キーボード3またはマウス4の終了指示(音声でも可能)があるまで、上述の処理を繰り返す。
【0041】終了の指示および記憶の指示で、メモリ13上のテキスト文書、所見リストのレコードはハードディスク16上に保存記憶される。なお、所見リストのレコードはハードディスク16上の所見リストに追加される。
【0042】図7に音声入力の内容と音声認識後の表示の一例を示す。
【0043】この例では糜爛、壊死などを示すコードが属性の示す“所見”により所見の欄に書き込まれる。
【0044】また、著しい等の“程度”を表す単語が表わされた場合、予め用意した変換テーブルを用いて、グレードを表す数値や記号に単語の文字列を変換してリストのレコードに記入する。
【0045】以上の処理を終了すると、CPU11の実行手順は図5のメニュー表示処理(ステップS10)に戻る。ユーザは次に、データベース登録処理を選択すると、CPU11は作成したテキスト文書およびこのテキスト文書に対応する所見リストのレコードをサーバ30上のデータベースに登録する(ステップS20→S30→S40→S50→S300)。データベース登録処理は衆知であり詳細な説明を要しないであろう。このとき、スキャナなどから読み込んだX線写真イメージとテキスト文書とを合体してもよいことは言うまでもない。
【0046】ユーザが報告書を帳票形態で印刷したいときはメニュー画面で報告書作成処理を選択する。この選択に応じてCPU11は帳票スタイルの文書をメモリ13上に作成する(ステップS20→S30→S40→S200)。より具体的には、タイトルや固定情報が記載されているひな型文書をハードディスク16からメモリ13上に読出し、次に、作成したテキスト文書の所見部分をコピーし、ひな型文書中の所定位置に貼付ける。また、患者のIDについては所見リストから取り出して、ひな型文書中に記載する(図8参照)。以上はCPU11により自動処理され、以後、ユーザはワープロ文書と同じようにキーボード3から修正指示を入力して文書の編集、修正を行う。」

・上記引用例1に記載の「所見作成装置」は、上記「ア.」の【請求項1】、「イ.」の記載事項、及び図1によれば、所見内容としてユーザにより入力された音声を認識する音声認識手段(音声認識合成装置12)と、該音声認識手段(音声認識合成装置12)の認識結果から所見を作成する所見作成装置10に関するものであり、
上記「イ.」の段落【0028】、「エ.」の記載事項によれば、所見作成装置10のCPU11は、装置全体のシステム制御を実行する他、所見作成プログラムにより所見を作成する所見作成処理を行うものであると理解できる。
・そして、上記「ア.」の【請求項2】?【請求項3】、「イ.」?「エ.」の記載事項によれば、所見作成装置10は、用語辞書を用いて、入力された音声の音声パターンと類似する音声パターンに対応の単語(句を含む。以下、同じ)を抽出することにより音声認識して認識単語を文字列コードに変換する音声認識手段(音声認識合成装置12)とともに、当該音声パターンに対応の属性を抽出することにより入力された音声(より正確には認識単語)の意味内容を判別する判別手段(CPU11)を有するものである。
なお、上記「イ.」の段落【0031】、「ウ.」の段落【0034】の記載事項によれば、属性は、認識単語がたとえば臓器名、部位、所見(症状)等の重要キーワードを持つ単語であるか否かを判別するのに必要なものである。
・上記「イ.」の段落【0027】、「ウ.」、「エ.」の段落【0037】、【0039】、【0042】の記載事項、及び図7によれば、認識単語、当該認識単語が集積されたテキスト文書すなわち所見は表示装置2の表示画面に表示させることができる。
・さらに、上記「イ.」の段落【0027】、「エ.」の段落【0046】の記載事項によれば、ユーザは成された所見に対してキーボード3から修正指示を入力して編集・修正を行うことができるものである。

したがって、上記記載事項及び図面を総合勘案すると、引用例1には、次の発明(以下、「引用発明」という。)が記載されている。
「所見内容としてユーザにより入力された音声を認識する音声認識合成装置と、装置全体のシステム制御を実行する他、所見作成プログラムにより所見を作成する所見作成処理を行うCPUとを備え、前記音声認識合成装置の認識結果から所見を作成する所見作成装置であって、
用語辞書を用いて、入力された音声の音声パターンと類似する音声パターンに対応の単語(句を含む。以下、同じ)を抽出することにより音声認識して認識単語を文字列コードに変換する前記音声認識合成装置とともに、当該音声パターンに対応する属性であって、認識単語がたとえば臓器名、部位、所見(症状)等の重要キーワードを持つ単語であるか否かを判別するのに必要な属性を抽出することにより認識単語の意味内容を判別する判別手段を有し、
認識単語や当該認識単語が集積されたテキスト文書である所見を表示装置の表示画面に表示させることができ、さらに、ユーザは作成された所見に対してキーボードから修正指示を入力して編集・修正を行うことができる所見作成装置。」

(3-2)引用例2
同じく原査定の拒絶の理由に引用された特開平7-325597号公報(以下、「引用例2」という。)には、「情報入力装置」について、図面とともに以下の各記載がある(なお、下線は当審で付与した)。
ア.「【請求項2】 情報の入力毎に、入力された情報の評価情報に基づいて入力された情報の確認時機を判断する判断手段と、
前記判断において参照する判断時機判定基準を記憶する判定基準記憶手段と、
判断手段により判断された確認時機に、情報が正しく入力されたか否かの確認処理を実行する確認処理手段と、
前記入力確度情報および確認処理結果を記憶する記憶手段と、
前記記憶手段の内容に基づいて前記判断基準を最適化して更新する更新手段とを具備することを特徴とする情報入力装置。」

イ.「【0005】
【課題を解決するための手段】本発明の情報入力方法は、情報の入力毎に、入力された情報の評価情報(例、認識率の基になる標準パターンとの距離、類似度、あるいは入力情報の重要度などの入力の確認の必要性を評価する情報)に基づいて入力された情報の確認時機を判断し、その判断の結果、確認時機であったときに、情報が正しく入力されたか否かの確認処理を実行することを特徴とする。また、本発明の情報入力装置は、情報の入力毎に、入力された情報の前述の評価情報に基づいて入力された情報の確認時機を判断する判断手段(30)と、その判断において参照する判断時機判定基準を記憶する判定基準記憶手段(41)と、判断手段により判断された確認時機に、情報が正しく入力されたか否かの確認処理を実行する確認処理手段(20)と、前記評価情報および確認処理結果を記憶する記憶手段(43)と、その記憶手段の内容に基づいて前記判断基準を最適化して更新する更新手段(50)とを具備する。
【0006】
【作用】一般に、確認作業を行う時機には以下の2種類が考えられる。入力者が情報を1項目入力する度にすぐに行う方法と、情報が2項目以上まとまってから行う方法である。すぐに確認作業を行う方法は、入力された情報が誤っている可能性が高い時に有効で、2項目以上まとまってから確認作業を行う方法は、入力された情報が正しい可能性が高い時に有効である(インターナショナル マン-マシンスタディーズ,第28巻,(1988),アインスワース,「エラー修正を伴った音声数字入力における入力長の最適化」p.573-581[Int.J.Man-Machine Studies,Vol.28,(1988),W.A.Ainsworth:“Optimization of String length for Spoken Digit Input with Error Correction”])。特に音声認識のように誤認識の発生が避けられない入力においては、1項目入力する度にすぐに行う方法と、情報が2項目以上まとまってから行う方法の、入力時間と音声認識率との関係が、それぞれ図5に示す関係になっている。音声以外の入力方式に対しても、装置からの出力が音声メッセージを利用する場合や、認識処理やデータの通信に時間を必要として入力装置の反応のサイクルに時間を要する入力に対しては、上記と同様の関係は成立する。したがって、本発明の情報入力方法は、入力された情報が受理できるか受理できないかといった機能的な基準だけではなく、入力された情報が正しい可能性が高いか低いかといった入力確度や、誤った入力がされると影響の大きい入力かどうかなどの情報の重要性などの入力の確認の必要性を評価する評価情報によって、確認時機を判定し、情報が入力される度に、確認作業を行う時機を適宜変更することにより、正しい情報を効率よく入力できるようにする。これは、人間同士の会話においても、聞き取りにくかったり、重要そうな内容については、すぐ聞き返すことと対応するように、自然な情報入力の技術であるともいえる。このように、本発明によれば、入力者によって情報が入力されると、その情報の確度や重要性を推定し、その推定結果に応じて確認作業を行う時機を判定し、判定された確認作業の時機が来た時に確認作業を行うようにしたので、入力された情報に応じて最適な確認の時機を得ることが可能となる。」

ウ.「【0009】まず利用者は、マイクロホン11に向かって入力する項目を発声する。マイクロホン11から入力された音声は、音声認識装置12によって認識される。音声認識装置12の出力データは、第一候補の認識結果とそのスコア、および、第一候補と第二候補の認識スコアの差である。これらの、音声認識装置12の出力データは、対話状態管理手段20へ渡される。対話状態管理手段20は、確認をすぐ取るべきか否かを決定するためのデータを収集し確認時機判定手段30に渡す。すなわち、第一候補の認識結果、第一候補のスコア、第一と第二候補のスコアの差などの音声認識装置12の出力データとあわせて、対話状態記憶手段42を参照して、今まで確認しないで保存していた既入力項目の数や対話の区切りなどを初めとする対話状態など確認時機判定に必要なデータを、確認時機判定手段30に渡す。
【0010】確認時機判定手段30では、確認する時機を決定する。この決定手順のフローチャートを図7に示す。確認時機判定手段30は、対話状態管理手段20からデータを受け取り(ステップS201)、その受け取った入力された項目によって対話の状態が一区切りついたかどうか判定する(ステップS211)。対話の状態が一区切りつくとは、例えばスケジュールの登録をするタスクにおいては、月、日付、時間、用件、の4項目が一区切りであると考えられる。すべての入力が終了した時も区切りがついたといえる。区切りがつけばそれまでの入力をすぐ確認する必要があると結論づけられるので、確認時機の決定処理を行う(ステップS282)。区切りがつかない場合には、いままで入力された項目でまだ確認されていない項目が3個未満であるか否かを調べる(ステップS221)。3個以上ある場合には、溜まりすぎているということで、確認されていない項目すべてをすぐ確認する必要があると結論づけられ、確認時機の決定処理を行う(ステップS282)。3個も溜まっていない場合には、次に入力された項目が重要であるかどうか判断するため、認識結果がその時の状態において重要な単語であるかどうかのリストを参照して認識結果が重要な単語であるか否かを判定する(ステップS251)。次に、確認時機を決定するために、判定基準を参照する(ステップS252)。本実施例では、認識単語の重要性、第一候補の認識スコア、第一候補と第二候補のスコアの差をもとに判定基準を参照する。判定基準のどの領域に区分されたかによって確認時機を判定結果とする(ステップS281)。判定結果は対話状態管理手段20へ送出する(ステップS290)。
【0011】確認時機判定基準の一具体例の概念図を図9に示す。図9の例は、第一候補の認識スコア、および、第一候補と第二候補の認識スコアの差によって確認時機を定めている。横軸が第一候補の認識スコアであり、右に行くほどよいスコアである。縦軸が第一候補と第二候補の認識スコアの差であり、上に行くほどスコアの差が大きい。図9の判定基準を利用すると、認識スコアに従って、領域2に分類される場合はすぐに確認を取り、領域3に分類される場合は後でまとめて確認を取ると判断する。領域5は、単語の重要性によって変わる部分であり、重要な単語の時はすぐ確認を取り、重要な単語でない時は後でまとめて確認をとると判断する。重要な単語かどうか判定するのは、確認時機判定基準記憶手段41に記憶された重要語リストを参照して行う。重要語リストの例を図8に示す。以上のようにして、決定された確認の時機を対話状態管理手段20に送出して、確認時機判定の手続は終了する。なお、図9の左上のグレーに色づけられたところは、第二候補の認識スコアが負の値になる部分を示す。この例では、認識スコアは正の値であると考えているので、このグレーの領域にはデータが存在しない。
【0012】対話状態管理手段20は、確認時機判定手段30によって決定された確認の時機に応じて、すぐに確認する場合とそうでない場合とがある。
(1) すぐ確認をする場合には、対話状態記憶手段42を参照し、今までに確認されていない入力項目が存在するのであれば、その入力項目とともに今回入力された項目を入力者に提示して、確認作業を行う。確認の結果誤りが検出されれば誤りの修正を行うことになるが、ここではその方法については省略する。確認の結果、正しいことが確認されると対話状態記憶手段42に、今回の入力の結果とともに確認を行った項目が確認済になったことを記録して次の入力に進む。
(2) すぐに確認をしない場合には、今回入力された結果とともに、確認がすんでいない入力であることを記録し次の入力に進む。
【0013】入力された項目の確認や、次の入力の促しなどの、装置から利用者に提示するメッセージは、対話状態管理手段20の指示に応じて、出力情報生成手段80が出力情報記憶手段43に記憶されていたメッセージを読み出し、音声合成装置81によって音声信号を合成しアンプ91とスピーカ92を介して入力者に提示される。このようにして進行する情報入力における入力者と装置との対話の様子を図10に示す。
【0014】以上に説明したように、本実施例は、入力者によって情報が入力されると、その情報の確度や重要性を推定し、その推定結果に応じて確認作業を行う時機を判定し、判定された確認作業の時機が来た時に確認作業を行うようにしたので、入力された情報に応じて最適な確認の時機を得ることが可能となる。」 (なお、数字に○を付した記号を、数字に( )を付した記号で代用した。)

エ.「【0018】対話状態管理手段20では、確認時機判定手段30で決定された確認時機に従い、入力の確認または次の入力の受付を行う。
(1) すぐ確認をすべきと判断された時は、確認する内容を出力情報生成手段80に送る。出力情報生成手段80は、確認すべき項目の確認を行う時に出力すべき情報を、出力情報記憶手段43から読み出し、情報の種類に応じてディスプレイ92の表示を変化させたり、アンプ91スピーカ92を通して音声メッセージを提示して、入力者に送出する。そして、入力者は入力した情報が確認でき、正しいか誤りがあるかをさらにタッチパネル13から入力する。この時に、正しい時には何も入力しないという割当ても可能である。誤りがある場合は誤りを修正する。対話状態管理手段20は、入力者からの正しいか誤りがあるかの入力に応じて、対話状態記憶手段42に確認ができた項目に対しては、確認ができたことを記録し、誤りがあった入力に対しては訂正を加えて対話状態を更新し、次の入力を受け付ける状態になる。」(なお、数字に○を付した記号を、数字に( )を付した記号で代用した。)

・上記引用例2に記載の「情報入力装置」は、上記「ア.」の記載事項によれば、情報の入力毎に、入力された情報の確認時機を判断し、その判断された確認時機に、情報が正しく入力されたか否かの確認処理を実行するようにした情報入力装置に関するものである。
・上記「イ.」の段落【0006】、「ウ.」の段落【0009】の記載事項、図6によれば、情報の入力は、例えば入力者により音声が入力され、音声認識されることによりなされるものである。
・上記「イ.」、「ウ.」の記載事項によれば、入力された情報の確認時機の判断は、すぐに確認作業(処理)を行うか、あるいは後でまとめて確認作業(処理)を行うかを入力された情報の評価情報に基づいて行われるものである。
そして、入力された情報の評価情報とは、その情報が正しい可能性が高いか低いかといった確度や、誤った入力がなされると影響の大きい入力かどうかといった重要な単語かどうかなどの重要度(重要性)であり、例えば入力された情報が重要と判定された場合にはすぐに確認作業(処理)を行い、そうでない場合には後でまとめて確認作業(処理)を行うものである。
・上記「ウ.」の段落【0012】?【0013】、「エ.」の記載事項によれば、入力された情報の確認作業(処理)は、入力者に音声メッセージを提示したり、ディスプレイの表示を変化させたりして、誤りがあれば修正を行うようにしたものである。

したがって、上記記載事項及び図面を総合勘案すると、引用例2には、次の技術事項が記載されている。
「入力者により入力され音声が音声認識されてなる情報の入力毎に、入力された情報の確認時機を判断し、その判断された確認時機に、情報が正しく入力されたか否かの確認処理(入力者に音声メッセージを提示したり、ディスプレイの表示を変化させたりして、誤りがあれば修正を行う)を実行するようにした情報入力装置において、
入力された情報における、誤った入力がなされると影響の大きい入力かどうかといった重要な単語かどうかなどの重要度(重要性)等の評価情報に基づいて、すぐに確認処理を行うか、あるいは後でまとめて確認処理を行うかの確認時機の判断を行い、
例えば入力された情報が重要と判定された場合にはすぐに確認処理を行い、そうでない場合には後でまとめて確認処理を行うようにしたこと。」

4.対比
そこで、本願発明と引用発明とを対比すると、
(1)引用発明における、所見内容としてユーザにより入力される「音声」、認識単語が集積された「テキスト文書である所見」、認識単語の「意味内容」は、それぞれ本願発明でいう「発話」、転写されて得られた「筆記録」、「語義的意味」に相当するといえ、
引用発明における「所見内容としてユーザにより入力された音声を認識する音声認識合成装置と、装置全体のシステム制御を実行する他、所見作成プログラムにより所見を作成する所見作成処理を行うCPUとを備え、前記音声認識合成装置の認識結果から所見を作成する所見作成装置であって、用語辞書を用いて、入力された音声の音声パターンと類似する音声パターンに対応の単語(句を含む。以下、同じ)を抽出することにより音声認識して認識単語を文字列コードに変換する前記音声認識合成装置とともに、当該音声パターンに対応する属性であって、認識単語がたとえば臓器名、部位、所見(症状)等の重要キーワードを持つ単語であるか否かを判別するのに必要な属性を抽出することにより認識単語の意味内容を判別する判別手段を有し、認識単語や当該認識単語が集積されたテキスト文書である所見を表示装置の表示画面に表示させることができ・・」によれば、
(a)引用発明においても、所見内容としてユーザにより入力された音声は音声認識合成装置によって音声認識されるのであり、このことは本願発明でいう「発話が音声認識され」ることに他ならない。
(b)さらに、引用発明は、音声パターンに対応する属性であって、認識単語がたとえば臓器名、部位、所見(症状)等の重要キーワードを持つ単語であるか否かを判別するのに必要な属性を抽出することにより認識単語の意味内容を判別する判別手段を有しており、かかる意味内容の判別はCPU(コンピュータ)でなされ、単語が認識される毎に行われるものであるといえることを考慮すると、引用発明においても、本願発明でいう「転写されて得られた第1の筆記録の第1の部分の第1の語義的意味をエンコードするための第1の意味エンコード手段」と「前記第1の筆記録の第2の部分の第2の語義的意味をエンコードするための第2の意味エンコード手段」を備えているとみることができる。
したがって、本願発明と引用発明とは、「発話が音声認識され、転写されて得られた第1の筆記録の第1の部分の第1の語義的意味をエンコードするための第1の意味エンコード手段」と「前記第1の筆記録の第2の部分の第2の語義的意味をエンコードするための第2の意味エンコード手段」とを備える点で一致するということができる。

(2)引用発明における「認識単語や当該認識単語が集積されたテキスト文書である所見を表示装置の表示画面に表示させることができ、さらに、ユーザは作成された所見に対してキーボードから修正指示を入力して編集・修正を行うことができる所見作成装置。」によれば、
引用発明の「所見作成装置」においても、作成された所見に対してキーボードから修正指示を入力して編集・修正を行うことができるものであるから、本願発明でいう「筆記録を検証する検証手段」を備えているということができる。
したがって、本願発明と引用発明とは、後述の相違点はあるものの「前記筆記録を検証するための検証手段と」を備える「装置」である点で共通するといえる。

よって、本願発明と引用発明とは、
「発話が音声認識され、転写されて得られた第1の筆記録の第1の部分の第1の語義的意味をエンコードするための第1の意味エンコード手段と、
前記第1の筆記録の第2の部分の第2の語義的意味をエンコードするための第2の意味エンコード手段と、
前記筆記録を検証するための検証手段と、
を備える装置。」
である点で一致し、次の点で相違する。

[相違点1]
本願発明では、「前記第1の語義的意味に基づいて、前記筆記録の前記第1の部分に、優先度の高い第1のサービスレベルを割り当てるための第1のサービスレベル割り当て手段」及び「前記第2の語義的意味に基づいて、前記筆記録の前記第2の部分に、優先度の低い第2のサービスレベルを割り当てるための第2のサービスレベル割り当て手段」とを備え、「前記第1のサービスレベル割り当て手段は、前記第1の部分が人間による検証を必要とするかどうかを決定するための手段と、前記第1の部分が人間による検証を必要とするかどうかに基づいて、前記第1の部分に前記第1のサービスレベルを割り当てるための手段と、を含む」と特定するのに対し、引用発明では、そのような特定を有してない点。

[相違点2]
検証手段について、本願発明では、「前記第1および第2のサービスレベルに応じて」行われるものであり、「第1の時間に前記第1の部分を検証するための手段と、前記第1の時間より後であって、ユーザーに前記筆記録を使用させた後である第2の時間に前記第2の部分を検証するための手段と、を備え」る旨特定するのに対し、引用発明では、そのような特定を有してない点。

5.判断
上記相違点について検討する。
[相違点1]及び[相違点2]について
引用例2(上記「3.(3-2)」を参照)には、「入力者により入力され音声が音声認識されてなる情報の入力毎に、入力された情報の確認時機を判断し、その判断された確認時機に、情報が正しく入力されたか否かの確認処理(入力者に音声メッセージを提示したり、ディスプレイの表示を変化させたりして、誤りがあれば修正を行う)を実行するようにした情報入力装置において、入力された情報における、誤った入力がなされると影響の大きい入力かどうかといった重要な単語かどうかなどの重要度(重要性)等の評価情報に基づいて、すぐに確認処理を行うか、あるいは後でまとめて確認処理を行うかの確認時機の判断を行い、例えば入力された情報が重要と判定された場合にはすぐに確認処理を行い、そうでない場合には後でまとめて確認処理を行う」ようにした技術事項が記載されている。ここで、
(a)上記引用例2に記載の技術事項において、入力された情報の評価情報である「誤った入力がなされると影響の大きい入力かどうかといった重要な単語かどうかなどの重要度(重要性)」は、本願発明でいう「語義的意味」に相当するといえ、
(b)上記引用例2に記載の技術事項における「・・評価情報に基づいて、すぐに確認処理を行うか、あるいは後でまとめて確認処理を行うかの確認時機の判断を行い・・」によれば、実質的に、第1の語義的意味に基づいて、入力された情報の第1の部分に優先度の高い第1のサービスレベルを割り当てるための第1のサービスレベル割り当て手段、及び第2の語義的意味に基づいて、入力された情報の第2の部分に優先度の低い第2のサービスレベルを割り当てるための第2のサービスレベル割り当て手段とを備えているとみることができ、
(c)そして、上記引用例2に記載の技術事項ににおける「・・入力された情報の確認時機を判断し、その判断された確認時機に、情報が正しく入力されたか否かの確認処理(入力者に音声メッセージを提示したり、ディスプレイの表示を変化させたりして、誤りがあれば修正を行う)を実行する・・・・入力された情報が重要と判定された場合にはすぐに確認処理を行い、そうでない場合には後でまとめて確認処理を行う」によれば、
(c-1)前記第1および第2のサービスレベルに応じて入力された情報を検証(確認処理)するための検証手段を備え、当該検証手段は、第1の時間(つまり、すぐに)に前記第1の部分を検証するための手段と、前記第1の時間より後である第2の時間(つまり、後でまとめて)に前記第2の部分を検証するための手段とをさらに備えるとみることができ、
(c-2)また、確認処理は、入力者に音声メッセージを提示したり、ディスプレイの表示を変化させたりした後、当然人間である入力者によって検証(確認)がなされ、誤りがあれば修正が行われるものであるから、前記第1のサービスレベル割り当て手段は、前記第1の部分が人間による検証を必要とするかどうかを決定するための手段と、前記第1の部分が人間による検証を必要とするかどうかに基づいて(正確には「前記第1の部分が人間による検証を必要とする場合には」)、前記第1の部分に前記第1のサービスレベルを割り当てるための手段とを含むとみることができるものである。

そして、上記引用例2に記載の技術事項は、結局のところ、引用例2の段落【0006】に記載のように、人間同士の会話においても、例えば重要そうな内容についてはすぐ聞き返すということと対応する、自然な情報入力の技術事項であるといえるものであり、引用発明においてもかかる技術事項を採用し、相違点1及び相違点2に係る構成とすることは当業者であれば容易になし得ることである。

そして、本願発明が奏する効果についてみても、引用発明及び引用例2に記載の技術事項から当業者が予測できたものであって、格別顕著なものがあるとはいえない。

なお、請求人は審判請求書において、上記引用例2(引用文献3)に関して、「・・『音声認識の質(認識スコア)に基づいて、図9に示すように、各領域に分類し、その分類に応じた、確認の優先度を決定する』という構成を、重要な発明の基本構成としており、・・・・一方の『情報の重要性』のみを抽出して、本願発明の構成を容易に想到可能とするのは、あまりに不自然であり、これは、本願発明を認識した上での恣意的判断に他ならず、容認されるべきではありません。」などと主張している。
しかしながら、上記引用例2に記載の技術事項における評価情報としては、入力情報の「確度」(具体的には認識スコア等)、つまり人間同士の会話でいえば聞き取り易いか聞き取り難いかの程度と、入力情報の「重要な単語かどうかなどの重要度(性)」とは独立した観点によるものであり、必ず両者を関連付けて用いなければならないものではないことは明らかであり、いずれか一方のみを用いてもよいことは当業者であればごく普通に想到し得ることであるから、請求人の上記主張は採用できない。
なお、本願明請求項6の記載によれば、第1および第2のサービスレベルの割り当てを「語義的意味」のみに基づいて行うものであるとは必ずしも特定(限定)されていない。

6.むすび
以上のとおり、本願の請求項6に係る発明は、引用発明及び引用例2に記載の技術事項に基づいて当業者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができない。
したがって、本願は、その余の請求項について論及するまでもなく拒絶すべきものである。
よって、結論のとおり審決する。
 
審理終結日 2015-03-23 
結審通知日 2015-03-31 
審決日 2015-04-13 
出願番号 特願2009-516739(P2009-516739)
審決分類 P 1 8・ 121- Z (G10L)
最終処分 不成立  
前審関与審査官 間宮 嘉誉安田 勇太  
特許庁審判長 丹治 彰
特許庁審判官 井上 信一
酒井 朋広
発明の名称 音声認識方法  
代理人 特許業務法人広江アソシエイツ特許事務所  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ