• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない。 H04M
管理番号 1266853
審判番号 不服2009-23761  
総通号数 157 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2013-01-25 
種別 拒絶査定不服の審決 
審判請求日 2009-12-03 
確定日 2012-12-14 
事件の表示 特願2005-183062「視覚的な監視チャネルを有する対話式音声処理のための方法および装置」拒絶査定不服審判事件〔平成18年 1月12日出願公開、特開2006- 14330〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 1.手続の経緯と本願発明
本件出願は、本願は、平成17年6月23日(パリ条約による優先権主張2004年6月23日、米国)の出願であって、平成20年12月24日付け拒絶理由通知に対して平成21年7月6日付けで意見書と手続補正書が提出されたが、同年7月28日付けで拒絶査定がなされ、これを不服として同年12月3日付けで審判請求がなされたものであって、その請求項1に係る発明(以下、「本願発明」という。)は、平成21年7月6日付け手続補正書の特許請求の範囲の請求項1に記載された以下のとおりのものと認める。

「ユーザとIVR(対話式音声応答)システムの間の対話を監視する方法であって、
複数のコマンドを有するIVRスクリプトに従って前記ユーザからの音声通信を処理するステップと、
前記IVRスクリプトに基づいてエージェントに前記音声通信の視覚表示を提示するステップと、を含み、
前記視覚表示が、前記音声通信と実質上同時に提示されかつ前記ユーザから取得された情報を取り込むために少なくとも1つのフィールドを有し、
前記フィールド内に取り込まれた前記情報が前記エージェントによって更新される方法。」

2.引用発明
原査定の拒絶の理由に引用された特開平10-322450号公報(以下、「引用例」という。)には、「音声認識システム、コールセンタシステム、音声認識方法及び記録媒体」に関し、図面とともに以下の事項が記載されている。

ア.「【0001】
【発明の属する技術分野】本発明は、利用者の音声を認識する対話型の音声認識システムにおいて、より認識精度を高めることができる音声認識システム及び記録媒体に関する。また、オペレータの作業の負荷を軽減することができる音声認識システム、コールセンタシステム、音声認識方法及び記録媒体に関する。」(第3頁第4欄第1?7行)

イ.「【0017】
【発明の実施の形態】本発明の実施の形態にかかる音声認識システムについて、商品に関する問い合わせ、修理依頼等を電話で受け付けるサポートセンタに設置された音声認識システムを例に以下図面を参照して説明する。
【0018】この音声認識システムは、図1に示すように、回線制御部11と、オペレータ操作部12と、音声認識部13と、主制御部15と、データベース17と、を備える。回線制御部11は、利用者の電話からの音声を公衆回線を介して受信し、音声認識部13に転送する。また、回線制御部11は、回線の接続・切断等を行う。オペレータ操作部12は、マイク、キーボード、スピーカ、表示装置、等を備える。
【0019】音声認識部13は、回線制御部11とオペレータ操作部12からのアナログ形式の音声データをデジタルデータに変換するA/D変換部を備える。音声認識部13は、音声データをA/D変換部でデジタルデータに変換し、認識処理を行う。認識方法は、認識結果とその結果が正しい確率(尤度)が得られる方法であれば、確率モデルを用いた方法、線形計画法を用いた方法、実験に基づいた方法等、任意である。音声認識部13は、認識結果と尤度とを主制御部15に送信する。
【0020】主制御部15は、音声認識部13からの利用者の音声とオペレータの音声の認識結果の比較処理を行い、また、この音声認識システム全体を制御する。また、主制御部15は、利用者がユーザIDを発音した場合、データベース17を参照して、該当する利用者の情報(利用者情報)を読み出し、オペレータ操作部12の表示装置に表示する。データベース17は、例えば、図2に示すように、利用者に付与されたユーザIDをキーとして、利用者名、住所、電話番号、等の利用者情報を記憶する。
【0021】本システムは、利用者の音声の認識結果を暫定的な認識結果としてオペレータに提示して、オペレータによる人為的ミスを削減すると共に、利用者の音声の認識結果とオペレータの音声の認識結果とを比較(マッチング)することにより、その認識精度を高めることができる音声認識システムである。」(第5頁第7欄第31行?同頁第8欄第18行)

ウ.「次に、このシステムにおける処理の流れについて図3を参照して説明する。
【0022】まず、音声認識システムの回線制御部11が、公衆回線を介して利用者からの電話(発呼)を受信する(P1)。これに応答して、主制御部15は、「どのような御用件ですか?」等の用件の入力(発声)を促す旨のガイダンスを送信する(P2)。利用者は、このガイダンスに応答して、「故障修理をお願いします。」等の用件を発声する(P3)。主制御部15は、この音声の受信に応答して、オペレータ操作部12のスピーカを介してオペレータに利用者の音声を供給する(P4)と共に音声認識部13に受信した音声の認識を指示する。
【0023】音声認識部13は、この指示に従い、利用者の音声を認識し、認識結果とその尤度を主制御部15に送信する。主制御部15は、認識結果に対応する画面(例えば、認識結果が「故障修理」の場合、故障修理受付画面)をオペレータ操作部12の表示装置に表示する(P5)。オペレータは、「故障修理ですね。」のように、利用者からの音声が示す事項を復唱する。ここで、オペレータは、表示画面より認識結果が正しいと判断した場合、その表示画面(例えば、故障修理受付画面)を参照しながら復唱することができる。オペレータの音声は、オペレータ操作部12のマイクを介して主制御部15に送られる(P6)。
【0024】主制御部15は、回線制御部11と公衆回線を介してオペレータの音声を利用者に供給する(P7)と共に音声認識部13に音声の認識を指示する。音声認識部13は、この指示に従い、オペレータの音声を認識し、認識結果とその尤度を主制御部15に送信する。
【0025】ここで、主制御部15は、利用者の音声の認識結果及び尤度と、オペレータの音声の認識結果及び尤度と、を比較し、最終的な認識結果を生成する。」(第5頁第8欄第18行?第6頁第9欄第1行)

エ.「【0027】上記比較処理において、最終的な認識結果として、オペレータの認識結果を選択した場合、主制御部15は、オペレータ操作部12の表示装置に表示されている画面を、オペレータの音声の認識結果に対応する画面に変更し、初めに認識された利用者の音声の認識結果を訂正する(P8)。また、最終的な認識結果として、利用者の音声の認識結果を選択した場合、表示装置の表示画面は変更しない。
【0028】このようにして、利用者とオペレータの双方の音声を認識し、それらの認識結果を比較し、認識精度の高い方を選択することにより、より正確な認識結果を取得することができる。また、初めに認識した利用者の音声の認識結果を暫定的な認識結果としてオペレータに提示することにより、オペレータがその認識結果を参照して利用者の音声の内容を復唱することができる。これにより、聞き間違い等の人為的ミスを防ぎ、オペレータの作業の負荷を削減することができる。」(第6頁第9欄第30?46行)

オ.「【0029】また、1回の用件において、利用者からの入力(発声)が複数回必要な場合、上述の処理(図2のP2?P8)が繰り返される。例えば、利用者からの用件が「故障修理」の要求であった場合、主制御部15は、オペレータ操作部12の表示装置に図5に示すような複数の入力項目を備える画面を表示し、製品名を尋ねる旨のガイダンスを利用者に送信する(P2)。このガイダンスに応答して、利用は製品名を発声する(P3)。主制御部15は、この音声の受信に応答して、オペレータに利用者の音声を供給する(P4)と共に音声認識部13に受信した音声の認識を指示する。音声認識部13は、主制御部15からの指示を受けて、この製品名の認識処理を実行し、認識結果と尤度を主制御部15に渡す。
【0030】主制御部15は、図5に示す画面の製品名の入力欄B1に認識結果を表示する(P5)。オペレータは、スピーカからの利用者の音声(この場合、製品名)を復唱する(P6)。この際、オペレータは、表示された認識結果を正しいと判断した場合、画面の製品名の入力欄B1に表示された製品名を参照しながら復唱することができる。主制御部15は、復唱された製品名を利用者に供給する(P7)と共に音声認識部13に音声の認識を指示する。音声認識部13は、復唱された製品名の認識処理を行い、認識結果を主制御部15に渡す。主制御部15は、2つの認識結果に対して比較処理を行い、最終的な認識結果を決定する。ここで、2つの認識結果が異なり、最終的な認識結果をオペレータが発声した製品名の認識結果とした場合、表示画面の製品名の入力欄B1の認識結果を訂正する(P8)。又、最終結果を当初の認識結果として決定した場合、次の入力項目を尋ねるガイダンス(例えば、ユーザID)を利用者に送る(P2)。」(第6頁第9欄第47行?同頁第10欄第28行)

上記引用例の記載及び図面ならびにこの分野における技術常識を考慮すると、
・上記引用例の音声認識方法において、音声認識システムからのガイダンスに応答して、利用者は用件を発声する(摘記事項ウ,図3)が、このような音声のやりとりは、摘記事項アにおいて「対話型の音声認識システム」と表現されているように、「対話」ということができ、
・上記発声された音声は音声認識されてオペレータ操作部の表示装置に表示され(摘記事項ウ)、
・利用者の発声が複数回必要な場合、オペレータ操作部の表示装置に、複数の入力項目を備える画面を表示し、その入力欄B1に認識結果を表示する(摘記事項オ、図5)が、このような入力欄B1の表示は利用者の音声と実質的に同時に行われることは明らかであり、
・オペレータが発声した音声の認識結果により上記入力欄B1の認識結果は訂正され(摘記事項エ,オ)、

以上を総合すれば、上記引用例には、以下の発明(以下、「引用発明」という。)が開示されている。

「利用者と対話型音声認識システムの間の対話における音声認識方法であって、
前記利用者からの音声を音声認識するステップと、
オペレータに前記音声認識結果の表示を提示するステップと、を含み、
前記表示が、前記音声と実質上同時に提示されかつ前記利用者の発声した音声の認識結果を表示するために少なくとも1つの入力欄を有し、
前記入力欄内に表示された前記認識結果が前記オペレータによって訂正される方法。」

3.対比
本願発明と引用発明とを対比するに、
・引用発明の「利用者」、「オペレータ」はぞれぞれ本願発明の「ユーザ」、「エージェント」に相当し、
・引用発明の「対話型音声認識システム」は、利用者の発呼に応答して音声ガイダンスを送信するもので、対話式の音声応答システムということができるから、本願発明の「IVR(対話式音声応答)システム」に相当し、
・引用発明の「対話における音声認識方法」と本願発明の「対話を監視する方法」は、「方法」である点で共通し、
・引用発明の(利用者からの)「音声」は、公衆回線を介して受信した電話からの音声であるから(摘記事項イ)、本願発明の「音声通信」に相当し、
・引用発明の「音声認識」が「処理」の一種であることは明らかであるから、引用発明の「音声認識するステップ」は本願発明の「処理するステップ」に含まれ、
・引用発明の「表示」は表示装置への表示であるから、これを本願発明のように「視覚表示」と称することは任意であり、
・引用発明の「利用者の発声した音声の認識結果」は本願発明の「ユーザから取得された情報」に含まれ、また、これらの情報を表示する箇所として、引用発明の「入力欄」は本願発明の「フィールド」に相当し、
・引用発明の「表示するために」および「表示された」における「表示」は、入力欄内に収まるように表示することを意味するのは明らかであるから、これを(入力欄内に)「取り込む」と表現することができ、とすると、引用発明の「表示するために」、「表示された」はそれぞれ本願発明の「取り込むために」、「取り込まれた」に相当すると言え、
・引用発明の「認識結果」が「情報」の一種であることは明らかであるから、引用発明の「認識結果」は本願発明の「情報」に含まれ、
・引用発明の「訂正」と本願発明の「更新」は実質的に同義であり、

結局、両者は以下の点で一致ないし相違している。

(一致点)
「ユーザとIVR(対話式音声応答)システムの間の方法であって、
前記ユーザからの音声通信を処理するステップと、
エージェントに前記音声通信の視覚表示を提示するステップと、を含み、
前記視覚表示が、前記音声通信と実質上同時に提示されかつ前記ユーザから取得された情報を取り込むために少なくとも1つのフィールドを有し、
前記フィールド内に取り込まれた前記情報が前記エージェントによって更新される方法。」

(相違点1)
「方法」に関し、本願発明が「対話を監視する方法」であるのに対し、引用発明は「対話における音声認識方法」である点。
(相違点2)
「音声通信を処理するステップ」に関し、本願発明では「複数のコマンドを有するIVRスクリプトに従って」と限定しているのに対し、引用発明ではそのような限定が無い点。
(相違点3)
「音声通信の視覚表示を提示するステップ」に関し、本願発明では「前記IVRスクリプトに基づいて」と限定しているのに対し、引用発明ではそのような限定が無い点。

4.検討
まず、上記相違点1につき検討する。
引用例に、「利用者とオペレータの双方の音声を認識し、それらの認識結果を比較し、認識精度の高い方を選択することにより、より正確な認識結果を取得することができる。」(摘記事項エ)とあるように、引用発明の音声認識方法では、音声認識システムとの対話における利用者の音声の認識結果の精度は常に比較判断されており、このような状況は、対話が「監視されている」と表現することができる。
したがって、引用発明の「対話における音声認識方法」と本願発明の「対話を監視する方法」との間に実質的な差異があるとは認められない。

次に、上記相違点2,3につき以下にまとめて検討する。
本願発明の「IVRスクリプト」は、具体的には【図5】に記載されたような「VXMLコード」ないしは「VXMLスクリプト」を意味すると解されるが、IVRシステムにおいて、表示出力されるコンテンツデータやその表示出力手順をVXMLで記述することは、例えば、特開2002-215670号公報(段落【0007】-【0010】)、特開2003-5778号公報(段落【0030】-【0031】)、特開2004-32742号公報(段落【0002】-【0004】)等にも記載されているように周知技術である。
さらに、一般に、VXMLでは各種コマンドがタグを用いて記述されることは周知であり、VXMLで記述されたデータや手順を表現する用語として「VXMLスクリプト」は当業者により普通に用いられているものに過ぎない。
したがって、引用発明の方法の音声通信を処理するステップを、本願発明のように「複数のコマンドを有するIVRスクリプトに従って」と限定すること、および、音声通信の視覚表示を提示するステップを、本願発明のように「前記IVRスクリプトに基づいて」と限定すること、は、いずれも、上記引用発明の方法におけるIVRシステムに対して上記周知技術を単に用いることにより当業者が容易になし得ることである。

そして、本願発明が奏する効果も引用発明および周知技術から容易に予測出来る範囲内のものである。

5.むすび
以上のとおり、本願発明は、上記引用例に記載された発明および周知技術に基づいて、当業者が容易に発明をすることができたものと認められるから、特許法第29条第2項の規定により特許を受けることができない。

よって、結論のとおり審決する。
 
審理終結日 2011-07-25 
結審通知日 2011-07-27 
審決日 2011-08-09 
出願番号 特願2005-183062(P2005-183062)
審決分類 P 1 8・ 121- Z (H04M)
最終処分 不成立  
前審関与審査官 西脇 博志  
特許庁審判長 竹井 文雄
特許庁審判官 新川 圭二
宮田 繁仁
発明の名称 視覚的な監視チャネルを有する対話式音声処理のための方法および装置  
代理人 岡部 讓  
代理人 三山 勝巳  
代理人 朝日 伸光  
代理人 加藤 伸晃  
代理人 岡部 正夫  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ