• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 全部申し立て 2項進歩性  G10L
審判 全部申し立て 特36条6項1、2号及び3号 請求の範囲の記載不備  G10L
管理番号 1059444
異議申立番号 異議2001-70662  
総通号数 31 
発行国 日本国特許庁(JP) 
公報種別 特許決定公報 
発行日 1999-11-26 
種別 異議の決定 
異議申立日 2001-02-26 
確定日 2002-03-18 
異議申立件数
訂正明細書 有 
事件の表示 特許第3082746号「音声認識システム」の請求項1ないし8に係る特許に対する特許異議の申立てについて、次のとおり決定する。 
結論 訂正を認める。 特許第3082746号の請求項1ないし7に係る特許を維持する。 
理由 [1]手続の経緯
本件特許第3082746号の請求項1ないし8に係る発明は、平成10年5月11日に出願され、平成12年6月30日にその特許の設定登録がなされ、その後、中野映子より特許異議の申立がなされ、取消理由が通知され、その指定期間内である平成13年7月17日に訂正請求がなされたものである。
[2]訂正の適否についての判断
[2-1]訂正の内容
特許権者が求めている訂正の内容は、請求項6の削除である。
[2ー2]訂正の目的の適否、新規事項の有無及び拡張・変更の存否
上記訂正は、特許請求の減縮を目的とした明細書の訂正に該当し、新規事項の追加に該当せず、実質上特許請求の範囲を拡張し、又は変更するものではない。
[2-3]むすび
以上のとおりであるから、上記訂正は、特許法第120条の4第2項及び同条第3項で準用する第126条第2,3項の規定に適合するので、当該訂正を認める。
[3]特許異議の申立についての判断
[3-1]申立の理由の概要
申立人中野映子は、証拠として、甲第1号証(特公平6-25988号公報)、甲第2号証(IBM VoiceType Dictation 3.0 for Windows 95 Use’s Guide 1997.3)を提出し、特許請求の範囲の請求項1-5,7,8に係る発明についての特許は、特許法第29条第2項の規定に違反してなされたものであり、また請求項2,6に係る発明についての特許は、特許法第36条第6項の規定に違反してなされたものであるので、特許を取り消すべきものと主張している。
[3-2]本件発明
特許第3082746号の請求項1ないし7に係る発明(以下、それぞれ「本件発明1ないし7」という。)は、平成13年7月17日付けの訂正明細書の特許請求の範囲の請求項1ないし7に記載された事項により特定される次のとおりのものである。
【請求項1】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、前記音声認識手段による音声認識結果を保持する認識結果保持手段と、前記音声認識結果を表示画面に表示する表示手段と、前記音声認識結果について誤認識した個所を修正するための修正手段と、を備えた音声認識システムにおいて、前記表示画面に表示された音声認識結果である文字列でのカーソル移動操作に伴い、前記文字列の修正可能な単位の境界及び修正可能な範囲を判別し、前記範囲が容易に判別できるように強調表示するように制御する手段を備えたことを特徴とする音声認識システム。
【請求項2】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、前記音声認識手段による音声認識結果を保持する認識結果保持手段と、前記音声認識結果を表示画面に表示する表示手段と、前記音声認識結果について誤認識した個所を修正するための修正手段と、を備えた音声認識システムにおいて、ユーザが入力手段を通じてカーソル移動や文字列選択の操作を行った場合に、カーソルの位置および文字列選択状態を前記修正手段に通知する強調表示手段を備え、前記修正手段は、通知されたカーソルの状態と前記認識結果保持手段に保持されている認識結果から、修正操作を行う場合に、どの範囲が修正対象となるか判別し、その結果を前記強調表示手段に通知し、前記強調表示手段では、前記修正手段から前記通知を受けて前記表示手段の表示画面に表示された前記文字列のうち前記範囲を強調表示する、ことを特徴とする音声認識システム。
【請求項3】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、前記音声認識手段による音声認識結果を保持する認識結果保持手段と、キーボード及び/又はポインティングデバイスを含む入力手段と、音声認識結果を表示画面に表示する表示手段と、を備え、音声認識結果について誤認識した個所を修正する音声認識システムにおいて、前記表示画面に表示された音声認識結果について前記入力手段からの入力によるカーソル移動操作に伴い、該カーソル位置における修正可能な最小単位を強調して表示しその境界を判別容易とする強調表示手段と、前記入力手段からの修正操作により、前記強調表示手段により強調表示された前記修正可能な単位を修正する修正手段と、を備えたことを特徴とする音声認識システム。
【請求項4】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、前記音声認識手段による認識結果を保持する認識結果保持手段と、キーボード及び/又はポインティングデバイスを含む入力手段と、音声認識結果を表示画面に表示する表示手段と、を備え、音声認識結果について誤認識した個所を修正する音声認識システムにおいて、前記表示画面の画面上に表示された音声認識結果の文字列のうち、前記入力手段から入力される選択操作により、前記選択された文字列範囲内に、全部又は一部が含まれている修正可能な単位を、前記認識結果保持手段より読み込み、前記修正可能な単位の列全体の文字列範囲を通知する修正手段と、前記修正手段より通知された文字列範囲を強調して表示する強調表示手段と、を備え、前記修正手段では、ユーザの前記入力手段による修正操作により、前記強調表示手段により強調表示された範囲を修正する、ことを特徴とする請求項1記載の音声認識システム。
【請求項5】
前記修正手段が、前記入力手段で選択された文字列範囲内に、その表示の全部が含まれる修正可能な単位を、前記認識結果保持手段により読み込み、前記修正可能な単位の列全体の文字列範囲を前記強調表示手段に通知することを特徴とする請求項2乃至4のいずれか一に記載の音声認識システム。
【請求項6】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、前記音声認識手段による認識結果を保持する認識結果保持手段と、キーボード及び/又はポインティングデバイスを含む入力手段と、音声認識結果を表示画面に表示する表示手段と、を備え、音声認識結果について誤認識した個所を修正する音声認識システムにおいて、(a)前記表示手段の表示画面上に表示された音声認識結果の文字列でのカーソル移動時の位置と文字列の範囲選択状態を取得し、前記カーソルが文字列の範囲選択状態であるが否かを判定し、(b)文字列範囲の選択状態でない場合、前記カーソルの位置の修正単位を前記認識結果保持手段から読み出し、(c)文字列範囲の選択状態の場合、選択された範囲に全部又は一部が含まれる修正単位を前記認識結果保持手段から読み出し、(d)前記読み出した修正単位及びカーソルの範囲選択状態から、修正可能な文字列の範囲を決定し、この範囲を強調表示範囲とし、(e)前記決定された文字列の範囲を前記表示画面で強調表示し、(f)前記表示手段の表示画面に表示された文字列について、前記入力手段からの入力により修正操作が指示された際に、前記(d)での文字列範囲の決定処理と同様にして、その修正範囲を決定し、ユーザは、実際に表示画面に表示されて認識結果の文字列修正操作を行う為にカーソル移動や文字列選択を行った時点で、修正対象となる文字列範囲を把握できるようにしたことを特徴とする音声認識システム。
【請求項7】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、前記音声認識手段による認識結果を保持する認識結果保持手段と、キーボード及び/又はポインティングデバイスを含む入力手段と、音声認識結果を表示画面に表示する表示手段と、を備え、音声認識結果について誤認識した個所を修正する音声認識システムにおいて、(a)前記表示手段の表示画面上に表示された音声認識結果の文字列でのカーソル移動時の位置と文字列の範囲選択状態を取得し、前記カーソルが文字列の範囲選択状態であるが否かを判定する処理、(b)文字列範囲の選択状態でない場合、前記カーソルの位置の修正単位を前記認識結果保持手段から読み出す処理、(c)文字列範囲の選択状態の場合、選択された範囲に全部又は一部が含まれる修正単位を前記認識結果保持手段から読み出す処理、(d)前記読み出した修正単位及びカーソルの範囲選択状態から、修正可能な文字列の範囲を決定し、この範囲を強調表示範囲とする処理、(e)前記決定された文字列の範囲を前記表示手段の表示画面上に強調表示するように制御する処理、(f)前記表示手段の表示画面に表示された文字列について、前記入力手段からの入力により修正操作が指示された際に、前記(d)での文字列範囲の決定処理と同様にして、その修正範囲を決定する処理、の上記(a)〜(f)の処理を前記音声認識システムを構成するコンピュータで実行するためのプログラムを記録した記録媒体。
[3-3]引用刊行物に記載された発明
当審が通知した取消理由で引用した刊行物1(上記甲第1号証)には、「日本語情報入力方式」に関して、
(1)「マイクロホン1より入力される文節音声は増幅器2を介して、認識部3へ送られる。認識3では始端と終端を検出した後、従来知られている連絡単音節の認識法や音素認識や音節認識を基本とした認識法により認識することができる。」(公報第2頁右欄14行ないし18行)
(2)「4は認識結果を記憶する音節候補系列メモリであり、一文節に対応する複数の音節系列が信頼性の高い順に記憶されている。」(公報第2頁右欄2行ないし4行)
(3)「オペレータは「轍は」は入力しようとする文節ではないので、ファンクションボード9の異なり語キー11を打鍵して訂正を行う。」(公報第3頁左欄3行ないし5行)
(4)「制御部8は、このように複数の異なる音節系列に対応する候補がある場合、第4図(a)のように第1候補の「轍は」の横に”*”を付けて変換結果を出力するよう表示部7に指令する。なお、異なり語の存在を示す表示の方法としては、従来の同音異義語の存在を示す表示と異なる表示方法であればよい。この例の如く異なり語を”*”を付けて表示する場合、同音異義語については後述するように下線を付けて表示することが考えられる。表示の方法としては、この他輝度変調,網かけ,点滅などを組み合わせて使用できる。」(公報第2頁右欄44行ないし3頁左5行)
(5)「本実施例装置では、第1の実施例と同様にオペレータは音声を文節単位で発声し、次に文節キー17を打鍵し、次々と文章を音声で入力して行く。認識結果は、第1の実施例装置と同様に複数の音節系列を許容し、それらは自動的に文節単位でかな漢字変換され、表示部7のCRT上に漢字かな混じり分が次々と表示される。このときページバッファ中の各文節のかな漢字変換結果に、同音語あるいは異音語が含まれる場合には、第1の実施例と同様に何らかの方法でその存在を表示してもよい。文全体あるいは複数の文章を音声入力した後、オペレータが選択キー14を打鍵すると、制御部8はページバッファ6に格納されている同音語あるいは異音語が含まれる文節のかな漢字変換結果のところにポインタを移動し、CRT上に、例えば第6図に示したような方法で表示する。」(公報第3頁右欄12行ないし26行)
が記載されている。
また、刊行物2(上記甲第2号証)には、「単語の修正」に関して、
(1)「修正する単語をダブルクリックします。」(第89頁26行)
(2)「VoiceType Dictationでは、音声入力した1つの単語を2語として認識したり、2,3語を1語として認識したりすることがあります。そのような場合には、その1語または複数の単語を強調表示して修正します。」(第90頁15行ないし17行)
(3)用語の説明として強調表示について「単語をマークする操作です。目的の単語(1つあるいは複数)の前にマウス・ポインターを移動します。マウスの左ボタンを押さえながら、目的の単語の最後までドラックします。それから、マウス・ボタンを放します。」(第3頁24行ないし28行)
が記載されている。
[3-4]対比・判断
(1)本件発明1と刊行物発明との対比・判断
本件発明1と刊行物1ないし2に記載された発明とを対比すると、刊行物1ないし2の発明は、本件発明1における次に掲げる主要な事項を具備していないし、刊行物1ないし2には、この主要な事項を示唆する記載もなされていない。
音声認識結果について誤認識した個所を修正するものにおいて、「前記表示画面に表示された音声認識結果である文字列でのカーソル移動操作に伴い、前記文字列の修正可能な単位の境界及び修正可能な範囲を判別」
そして、上記主要な事項により、本件発明1は、「ユーザは認識単位の境界を容易に把握することができ、また、語句の修正操作を行う前に、ユーザは修正される語句の範囲を把握することができる。(【発明の効果】)」という効果を奏するものである。
したがって、本件発明1は、刊行物1ないし2に記載された発明に基づいて当業者が容易に発明をすることができたものとは認められない。
(2)本件発明2と刊行物発明との対比・判断
本件発明2と刊行物1ないし2に記載された発明とを対比すると、刊行物1ないし2の発明は、本件発明2における次に掲げる主要な事項を具備していないし、刊行物1ないし2には、この主要な事項を示唆する記載もなされていない。
音声認識結果について誤認識した個所を修正するものにおいて、
「前記修正手段は、通知されたカーソルの状態と前記認識結果保持手段に保持されている認識結果から、修正操作を行う場合に、どの範囲が修正対象となるか判別」
そして、上記主要な事項により、本件発明2は、「ユーザは認識単位の境界を容易に把握することができ、また、語句の修正操作を行う前に、ユーザは修正される語句の範囲を把握することができる。(【発明の効果】)」という効果を奏するものである。
したがって、本件発明2は、刊行物1ないし2に記載された発明に基づいて当業者が容易に発明をすることができたものとは認められない。
(3)本件発明3と刊行物発明との対比・判断
本件発明3と刊行物1ないし2に記載された発明とを対比すると、刊行物1ないし2の発明は、本件発明3における次に掲げる主要な事項を具備していないし、刊行物1ないし2には、この主要な事項を示唆する記載もなされていない。
音声認識結果について誤認識した個所を修正するものにおいて、「前記表示画面に表示された音声認識結果について前記入力手段からの入力によるカーソル移動操作に伴い、該カーソル位置における修正可能な最小単位を強調して表示しその境界を判別容易とする強調表示手段」
そして、上記主要な事項により、本件発明3は、「ユーザは認識単位の境界を容易に把握することができ、また、語句の修正操作を行う前に、ユーザは修正される語句の範囲を把握することができる。(【発明の効果】)」という効果を奏するものである。
したがって、本件発明3は、刊行物1ないし2に記載された発明に基づいて当業者が容易に発明をすることができたものとは認められない。
(4)本件発明4と刊行物発明との対比・判断
本件発明4は本件発明1を引用する請求項であり、本件発明1と同様、刊行物1ないし2に記載された発明に基づいて当業者が容易に発明をすることができたもとは認められない。
(5)本件発明5と刊行物発明との対比・判断
本件発明5は本件発明2乃至4のいずれか一を引用する請求項であり、本件発明2ないし4と同様、刊行物1ないし2に記載された発明に基づいて当業者が容易に発明をすることができたもとは認められない。
(6)本件発明6と刊行物発明との対比・判断
本件発明6と刊行物1ないし2に記載された発明とを対比すると、刊行物1ないし2の発明は、本件発明5における次に掲げる主要な事項を具備していないし、刊行物1ないし2には、この主要な事項を示唆する記載もなされていない。
音声認識結果について誤認識した個所を修正するものにおいて、「(b)文字列範囲の選択状態でない場合、前記カーソルの位置の修正単位を前記認識結果保持手段から読み出し、(c)文字列範囲の選択状態の場合、選択された範囲に全部又は一部が含まれる修正単位を前記認識結果保持手段から読み出し、(d)前記読み出した修正単位及びカーソルの範囲選択状態から、修正可能な文字列の範囲を決定し、この範囲を強調表示範囲とし、」
そして、上記主要な事項により、本件発明6は、「ユーザは認識単位の境界を容易に把握することができ、また、語句の修正操作を行う前に、ユーザは修正される語句の範囲を把握することができる。(【発明の効果】)」という効果を奏するものである。
したがって、本件発明6は、刊行物1ないし2に記載された発明に基づいて当業者が容易に発明をすることができたものとは認められない。
(7)本件発明7と刊行物発明との対比・判断
本件発明7と刊行物1ないし2に記載された発明とを対比すると、刊行物1ないし2の発明は、本件発明7における次に掲げる主要な事項を具備していないし、刊行物1ないし2には、この主要な事項を示唆する記載もなされていない。
音声認識結果について誤認識した個所を修正するものにおいて、「(b)文字列範囲の選択状態でない場合、前記カーソルの位置の修正単位を前記認識結果保持手段から読み出す処理、(c)文字列範囲の選択状態の場合、選択された範囲に全部又は一部が含まれる修正単位を前記認識結果保持手段から読み出す処理、(d)前記読み出した修正単位及びカーソルの範囲選択状態から、修正可能な文字列の範囲を決定し、その範囲を強調表示範囲とする処理」
そして、上記主要な事項により、本件発明7は、「ユーザは認識単位の境界を容易に把握することができ、また、語句の修正操作を行う前に、ユーザは修正される語句の範囲を把握することができる。(【発明の効果】)」という効果を奏するものである。
したがって、本件発明7は、刊行物1ないし2に記載された発明に基づいて当業者が容易に発明をすることができたものとは認められない。
[5]異議申立人の主張する本件発明2の記載不備についての検討
特許明細書の発明の詳細な説明には、「キーボード及びマウスのポインティングデバイス等の入力装置7」(同第5頁左欄4行ないし5行)と記載され、また、該キーボード及びマウスのポインティングデバイス等の入力装置は、周知の入力手段であるから、、本件発明2に記載されている「入力手段」が不明瞭であるとはいえない。
また、特許明細書の請求項6は訂正請求により削除されている。
したがって、訂正後の訂正明細書の各請求項の記載は、明確であり、特許法第36条第6項に規定する要件を満たしている。
[6]むすび
以上のとおりであるから、特許異議申立の理由及び証拠によっては、本件請求項1ないし7に係る発明を取り消すことはできない。
また、他に本件請求項1ないし7に係る発明の特許を取り消すべき理由を発見しない。
 
発明の名称 (54)【発明の名称】
音声認識システム
(57)【特許請求の範囲】
【請求項1】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、
前記音声認識手段による音声認識結果を保持する認識結果保持手段と、
前記音声認識結果を表示画面に表示する表示手段と、
前記音声認識結果について誤認識した個所を修正するための修正手段と、
を備えた音声認識システムにおいて、
前記表示画面に表示された音声認識結果である文字列でのカーソル移動操作に伴い、前記文字列の修正可能な単位の境界及び修正可能な範囲を判別し、前記範囲が容易に判別できるように強調表示するように制御する手段
を備えたことを特徴とする音声認識システム。
【請求項2】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、
前記音声認識手段による認識結果を保持する認識結果保持手段と、
前記音声認識結果を表示画面に表示する表示手段と、
前記音声認識結果について誤認識した個所を修正するための修正手段と、
を備えた音声認識システムにおいて、
ユーザが入力手段を通してカーソル移動や文字列選択の操作を行った場合に、カーソルの位置および文字列選択状態を前記修正手段に通知する強調表示手段を備え、
前記修正手段は、通知されたカーソルの状態と前記認識結果保持手段に保持されている認識結果から、修正操作を行う場合に、どの範囲が修正対象となるか判別し、その結果を前記強調表示手段に通知し、前記強調表示手段では、前記修正手段から前記通知を受けて前記表示手段の表示画面に表示された前記文字列のうち前記範囲を強調表示する、
ことを特徴とする音声認識システム。
【請求項3】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、
前記音声認識手段による認識結果を保持する認識結果保持手段と、
キーボード及び/又はポインティングデバイスを含む入力手段と、
音声認識結果を表示画面に表示する表示手段と、
を備え、音声認識結果について誤認識した個所を修正する音声認識システムにおいて、
前記表示画面に表示された音声認識結果について前記入力手段からの入力によるカーソル移動操作に伴い、該カーソル位置における修正可能な最小単位を強調して表示しその境界を判別容易とする強調表示手段と、
前記入力手段からの修正操作により、前記強調表示手段により強調表示された前記修正可能な単位を修正する修正手段と、
を備えたことを特徴とする音声認識システム。
【請求項4】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、
前記音声認識手段による認識結果を保持する認識結果保持手段と、
キーボード及び/又はポインティングデバイスを含む入力手段と、
音声認識結果を表示画面に表示する表示手段と、
を備え、前記音声認識結果について誤認識した個所を修正する音声認識システムにおいて、
前記表示手段の画面上に表示された音声認識結果の文字列のうち、前記入力手段から入力される選択操作により、前記選択された文字列範囲内に、全部又は一部が含まれている修正可能な単位を、前記認識結果保持手段より読み込み、前記修正可能な単位の列全体の文字列範囲を通知する修正手段と、
前記修正手段より通知された文字列範囲を強調して表示する強調表示手段と、
を備え、
前記修正手段では、ユーザの前記入力手段による修正操作により、前記強調表示手段により強調表示された範囲を修正する、
ことを特徴とする請求項1記載の音声認識システム。
【請求項5】
前記修正手段が、前記入力手段で選択された文字列範囲内に、その表示の全部が含まれる修正可能な単位を、前記認識結果保持手段より読み込み、前記修正可能な単位の列全体の文字列範囲を前記強調表示手段に通知することを特徴とする請求項2及至4のいずれか一に記載の音声認識システム。
【請求項6】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、
前記音声認識手段による認識結果を保持する認識結果保持手段と、
キーボード及び/又はポインティングデバイスを含む入力手段と、
音声認識結果を表示画面に表示する表示手段と、
を備え、音声認識結果について誤認識した個所を修正する音声認識システムにおいて、
(a)前記表示手段の表示画面上に表示された音声認識結果の文字列でのカーソル移動時の位置と文字列の範囲選択状態を取得し、前記カーソルが文字列の範囲選択状態であるか否かを判定し、
(b)文字列範囲の選択状態でない場合、前記カーソルの位置の修正単位を前記認識結果保持手段から読み出し、
(c)文字列範囲の選択状態の場合、選択された範囲に全部又は一部が含まれる修正単位を前記認識結果保持手段から読み出し、
(d)前記読み出した修正単位及びカーソルの範囲選択状態から、修正可能な文字列の範囲を決定し、この範囲を強調表示範囲とし、
(e)前記決定された文字列の範囲を前記表示画面で強調表示し、
(f)前記表示手段の表示画面に表示された文字列について、前記入力手段からの入力により修正操作が指示された際に、前記(d)での文字列範囲の決定処理と同様にして、その修正範囲を決定し、ユーザは、実際に表示画面に表示されて認識結果の文字列修正操作を行う為にカーソル移動や文字列選択を行った時点で、修正対象となる文字列範囲を把握できるようにした
ことを特徴とする音声認識システム。
【請求項7】
入力された音声を1又は複数の単語の列として音声認識する音声認識手段と、
前記音声認識手段による認識結果を保持する認識結果保持手段と、
キーボード及び/又はポインティングデバイスを含む入力手段と、
音声認識結果を表示画面に表示する表示手段と、
を備え、音声認識結果について誤認識した個所を修正する音声認識システムにおいて、
(a)前記表示手段の表示画面上に表示された音声認識結果の文字列でのカーソル移動時の位置と文字列の範囲選択状態を取得し、前記カーソルが文字列の範囲選択状態であるか否かを判定する処理、
(b)文字列範囲の選択状態でない場合、前記カーソルの位置の修正単位を前記認識結果保持手段から読み出す処理、
(c)文字列範囲の選択状態の場合、選択された範囲に全部又は一部が含まれる修正単位を前記認識結果保持手段から読み出す処理、
(d)前記読み出した修正単位及びカーソルの範囲選択状態から、修正可能な文字列の範囲を決定し、この範囲を強調表示範囲とする処理、
(e)前記決定された文字列の範囲を前記表示手段の表示画面上に強調表示するように制御する処理、
(f)前記表示手段の表示画面に表示された文字列について、前記入力手段からの入力により修正操作が指示された際に、前記(d)での文字列範囲の決定処理と同様にして、その修正範囲を決定する処理、
の上記(a)〜(f)の処理を前記音声認識システムを構成するコンピュータで実行するためのプログラムを記録した記録媒体。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、音声認識システムに関し、特に、音声認識結果について誤認識した個所を修正する機能を備えた音声認識装置に用いて好適なシステムに関する。
【0002】
【従来の技術】
図5に、従来の音声認識システムの構成の一例を示す。図5を参照すると、音声入力装置1は、ユーザからの音声を受け取り音声認識部2に渡す。
【0003】
音声認識部2は、入力された音声を認識し、認識結果を、認識結果保持部3に渡す。
【0004】
表示部4は、認識結果保持部3の内容を参照して認識結果を表示する。
【0005】
ユーザが入力装置7を通して修正操作を行うと、修正部5は認識結果保持部3の内容を修正し、その結果が表示部4により表示される。
【0006】
ユーザの修正操作は、具体的には、例えば「次候補キー」を押して第2位以下の候補を表示して、それらの候補の中から正しい語句を選択するという方法が挙げられる。
【0007】
この時、キーボード等で修正したい語句の位置にカーソルを移動したり、範囲指定により修正したい語句を選択してから修正操作を行うのが一般的である。
【0008】
音声認識装置や音声入力によるワードプロセッサ等に用いられる従来の音声認識システムの一例として、例えば特開平1-197797号公報には、音声認識結果の上位候補中に正解候補が含まれない場合でも上位候補音節から自動的に計算される後ろ向き確率によって入力音節を推定し候補として追加し正解候補が含まれる確率を増大するようにした方式が提案されている。
【0009】
【発明が解決しようとする課題】
しかしながら、図5を参照して説明した、従来の音声認識システムは、次のような問題点を有している。
【0010】
(1)第1の問題点は、ユーザにとって修正可能な単位の境界が判別しにくい、ということである。
【0011】
その理由は以下の通りである。ここでは、日本語の単語を修正可能な最小単位とする音声認識システムを例に説明する。なお、修正可能な最小単位を「修正単位」と呼ぶ。
【0012】
日本語では、単語の区切りは、文字列の表記上では明示されていないため、ユーザは表示を見ただけでは修正単位の境界を判別することは難しい。例えば、ある複数単語から成る複合語を1つの修正単位とする等、修正単位が日本語の単語と必ずしも一致しない音声認識システムもあるため、修正単位の境界の判別はさらに難しくなる。
【0013】
例えば修正単位の間にスペースを設けたり、修正単位毎に途切れた下線を引く等の方法で境界を明示しておく方法もあるが、その場合、音声入力によるワードプロセッサに適用した場合、画面上の表示と実際に作成されている文章の内容が異なる、という問題が出てくる。
【0014】
(2)第2の問題点は、音声認識結果を修正したい時に、画面上の文字列のどの範囲を指定すればよいかがユーザにとって不明確である、ということである。
【0015】
その理由は以下の通りである。音声認識システムでは、入力された文字列を任意の範囲で修正操作できるとは限らない。すなわち音声認識システムの制約により、選択した範囲によっては修正操作が行えない場合があるからである。具体的には例えば、息継ぎなしで連続して発声した範囲内でしか修正できない、一度に一
定数の修正単位の列しか修正できない、等の制約がある。
【0016】
そのため、修正操作は、ユーザがどのような範囲選択をしても行えるというものではなく、上記で述べたような制約のため、ユーザにとって修正操作が可能な範囲を理解することは、容易でない。
【0017】
このような場合、仮にユーザが修正できない範囲を選択して修正操作を行おうとした場合、システム側の対応としては例えば、ユーザの操作を無効として警告を発したり、ユーザが選択した範囲を最も近い修正可能な範囲に自動修正して修正を行ったりすることが考えられる。前者の場合は、ユーザは範囲修正をやり直して再び修正操作を行う必要があるため操作が煩雑になり、後者の場合は、ユーザの意図とは別の範囲の修正が行われる可能性があり、いずれの場合も効率よく修正操作を行うことができない。
【0018】
したがって本発明は、上記問題点に鑑みてなされたものであって、その目的は、ユーザが修正可能な単位の境界を簡単に判別できるようにした音声認識システムを提供することにある。
【0019】
本発明の他の目的は、ユーザが修正操作を行う前に修正範囲を確認できるようにした音声認識システムを提供することにある。
【0020】
【課題を解決するための手段】
前記目的を達成するため本発明による音声認識修正システムは、入力された音声を1又は複数の単語の列として音声認識する手段と、音声認識手段による認識結果を保持する認識結果保持手段と、音声認識結果を表示画面に表示する表示手段と、音声認識結果について誤認識した個所を修正する修正手段と、を備えた音声認識システムにおいて、前記表示画面に表示された認識結果である文字列でのカーソル移動操作に伴い、前記文字列の修正可能な単位の境界及び修正可能な範囲を判別して前記範囲が容易に判別できるように強調して表示する手段を備えたものである。
【0021】
本発明において、ユーザが入力手段を通してカーソル移動や文字列選択の操作を行った場合に、カーソルの位置および文字列選択状態を前記修正手段に通知する強調表示手段を備え、前記修正手段は、通知されたカーソルの状態と前記認識結果保持手段に保持されている認識結果から、修正操作を行う場合に、どの範囲が修正対象となるか判別し、その結果を前記強調表示手段に通知し、前記強調表示手段では、前記修正手段から前記通知を受け、前記表示手段の表示画面に表示された前記文字列のうち前記範囲を強調表示する。
【0022】
【発明の実施形態】
本発明の実施の形態について以下に説明する。本発明の音声認識システムは、その好ましい実施の形態において、表示画面に表示された音声認識結果である文字列でのカーソル移動に伴い、修正可能な単位の境界や、修正可能な範囲を調べ、その範囲が判別できるように強調して表示するように構成したものである。
【0023】
より詳細には、本発明の音声認識システムは、その好ましい実施の形態において、強調表示部(図1の6)は、ユーザが入力装置を通してカーソル移動や文字列選択の操作を行った場合にカーソルの位置および文字列選択状態を修正部(図1の5)に通知する。
【0024】
修正部(図1の5)は、強調表示部(図1の6)から通知されたカーソルの状態と、認識結果保持部(図1の3)に保持されている認識結果から、修正操作を行った場合に、どの範囲が修正対象となるかを判別し、その結果を強調表示部(図1の6)に通知する。
【0025】
強調表示部(図1の6)は、修正部(図1の5)からの通知を受け、表示部(図1の4)に表示された文字列のうちその範囲を強調表示する。
【0026】
本発明の音声認識システムは、その好ましい実施の形態において、以下のように動作し、強調表示部及び修正部の各ステップの処理はコンピュータ上で実行されるプログラムで実現することができる。
【0027】
ステップA1:強調表示部(図1の6)は、表示画面上に表示された音声認識結果の文字列でのカーソル移動時の位置と文字列の範囲選択状態を修正部(図1の5)に通知する。
【0028】
ステップA2:修正部(図1の5)では、カーソルが文字列の範囲選択状態であるか否かを判定する。
【0029】
ステップA3:文字列範囲の選択状態でない場合、前記カーソルの位置の修正単位を前記認識結果保持部から読み出す。
【0030】
ステップA4:文字列範囲の選択状態の場合、選択された範囲に全部が含まれる修正単位を前記認識結果保持部から読み出す。また選択された範囲に一部が含まれる修正単位を前記認識結果保持部から読み出す。
【0031】
ステップA5:読み出した修正単位及びカーソルの範囲選択状態から、修正可能な文字列の範囲を決定し、この範囲を強調表示範囲とする。
【0032】
ステップA6:決定された文字列の範囲を表示画面で強調表示する。
【0033】
表示部(図1の4)の表示画面に表示された文字列について、入力装置からの入力により修正操作が指示された際に、ステップA5の文字列範囲の決定処理と同様にして、その修正範囲を決定する。
【0034】
本発明の実施の形態において、強調表示を行う際に、指定された範囲を四角で囲む、色やフォントを変える、もしくは文字の背景色、文字色を変える、などの方法により、文字列(文章)中の、他の文字列とその範囲とが判別できるように、指定された範囲の表示に変化を加える。
【0035】
このように、本発明の実施の形態によれば、ユーザがカーソルを移動させた時に、カーソル位置の修正可能な単位が強調表示されることで修正可能な単位の境界がユーザに判別できるようになり、また、ユーザが選択した範囲から修正操作で修正される範囲を、操作を行う前にユーザが確認できる。
【0036】
【実施例】
次に、上記した実施の形態についてさらに詳細に説明すべく、本発明の実施例について図面を参照して詳細に説明する。
【0037】
図1は、本発明の一実施例の構成を示す図である。図1を参照すると、本実施例は、ユーザの音声を受け付ける音声入力装置1と、音声を認識する音声認識部2と、認識された結果を保持する認識結果保持部3と、認識結果を表示する表示部4と、認識結果の修正を行う修正部5と、文字列の一部を強調表示する強調表示部6と、キーボード及びマウスのポインティングデバイス等の入力装置7と、を含む。
【0038】
音声入力装置1は、ユーザの発声を入力し、ディジタル信号に変換してその音声データを音声認識部2に渡す。
【0039】
音声認識部2は、音声入力装置1より渡された音声データを、1つまたは複数の単語の列として音声認識し、認識結果を認識結果保持部3に渡す。
【0040】
認識結果保持部3は、音声認識部2より渡された認識結果を保持する。
【0041】
表示部4は、認識結果保持部3を参照して結果を表示画面に表示する。
【0042】
修正部5は、入力装置7からのユーザの修正指示に従い、認識結果保持部3の内容を修正する。また、強調表示部6よりカーソルの状態を受け取り、修正操作が適用される文字列の範囲を決定して強調表示部6に通知する。
【0043】
強調表示部6は、ユーザの入力操作によるカーソル移動や選択範囲変更の情報を、入力装置7より受け取り、修正部5に対して、カーソルの状態を通知して強調表示する範囲を修正部5に決定させ、表示部4に表示された文字列のうち該当する文字列を強調表示する。
【0044】
入力装置7は、ユーザの操作を受け取り、修正部5や強調表示部6に指示を送る。
【0045】
なお、日本語の単語を修正可能な最小単位とする音声認識システムに本発明を適用した実施例について、以下にその動作の詳細を説明する。
【0046】
図2は、本発明の一実施例の処理フローを示すフローチャートである。図1および図2を参照して、本実施例の動作について詳細に説明する。
【0047】
まず、ユーザが入力装置7を使用してカーソル移動や文字列選択を行ったとする。
【0048】
強調表示部6は、まずカーソル位置と文字列選択の状態を修正部5に通知する(ステップA1)。
【0049】
修正部5は、カーソルが選択状態であるかどうかを判断し(ステップA2)、カーソルが文字列選択状態でなかった場合、カーソル位置の修正単位を認識結果保持部3より読み込む(ステップA3)。ここで、カーソル位置が修正単位の間であった場合は、前後の修正単位のどちらでもよい。
【0050】
また、上記ステップA2でカーソルが文字列選択状態であった場合、修正部5は、選択されている範囲の修正単位全てに関する情報を、認識結果保持部3より読み込む(ステップA4)。ここで、選択範囲の両端の修正単位は、文字列の一部のみが選択状態になる場合もあるが、この場合、該修正単位を、認識結果保持部3から読み込むかどうかはどちらでもよい。
【0051】
修正部5は、上記ステップA3およびステップA4で読み込んだ修正単位の列およびカーソルの選択状態より修正操作が適用される文字列範囲(つまり強調表示をする文字列範囲)について決定する(ステップA5)。
【0052】
ここで、修正操作が適用される文字列範囲を修正部5で決めるのは、ユーザが選択した範囲で常に修正操作が行えるとは限らず、修正部5により修正操作が可能な範囲に制限が設けられるからである。この制限は、修正部5の機能にもよるが、例えば以下のようなものがある。
【0053】
第1に、キーボード入力された文字列が含まれる場合、その文字列は、修正可能な範囲から除外される場合がある。
【0054】
第2に、システムによっては、同じ発声内の修正単位の列のみ同時に修正可能であることがある。
【0055】
第3に、システムによっては同時に修正操作が可能な修正単位の個数に制限が設けられる場合がある。
【0056】
以上のステップA5により、強調表示の対象となる文字列範囲が決定されると、結果の文字列範囲が修正部5から強調表示部6に渡され、強調表示部6は、表示部4に表示されている文字列のうち、通知された文字列範囲を強調表示する(ステップA6)。
【0057】
この時の強調表示としては、例えば文字列を四角の枠で囲む、文字列にアンダーラインやオーバーラインを引くなどの修飾を施す、もしくは、文字列を網かけしたり背景を着色したりする、文字列の色やフォントを変更して表示する、あるいはそれらの表示や文字列自身を点滅表示させる、などしてもよい。
【0058】
ユーザにより実際に修正操作が指示されると、修正部5は、自動的に範囲を決定して、その範囲を修正する。この時、上記ステップA5で、修正部5が修正操作の適用される範囲を決めたのと同じ方法で決定されるため、上記ステップA5で修正部5が決定した範囲と実際に修正操作が行われる範囲は一致する。
【0059】
このため、ユーザは、実際に修正操作を行う前、つまりカーソル移動や文字列選択を行った時点で、修正対象となる文字列範囲を知ることができる。
【0060】
このように、本実施例では、ユーザのカーソル移動や範囲選択という操作が行われた時に、その時点で、修正対象となる文字列範囲を強調表示しているため、修正単位の境界や、修正可能な範囲を、ユーザは即時に知ることができる。
【0061】
なお、カーソル移動については、テキスト内の文字列挿入位置を示すカーソルのほかに、マウス等のポインティングデバイスによるマウスカーソルであってもよい。その場合、常に表示する方法のほかに、マウスカーソルが停止した時に上記処理を行う方法や、マウスカーソルが定められた時間同じ位置に停止していた時に上記処理を行う方法も考えられる。
【0062】
次に、具体的なデータを用いて本実施例について説明する。
【0063】
今、「本日の打ち合わせは」と音声で入力し、「本日の打ち合わせは」と認識結果が表示部4の画面に表示されたとする。この場合、単語は、「本日」、「の」、「打ち合わせ」、「は」の計4つであり、修正単位も同じである。
【0064】
ここで、入力装置7から、「ち」と「合」の間に、カーソルを移動させたとする。この時の表示部4の表示画面の一例を図3(a)に示す。
【0065】
強調表示部6は、カーソル位置と文字列選択の状態を修正部5に通知する。
【0066】
修正部5は、認識結果保持部3より、現在のカーソル81の位置にある「打ち合わせ」という修正単位を読み込む。
【0067】
次に、修正部5は、読み込んだ「打ち合わせ」という修正単位に対し、強調表示を行う範囲を決定する。ここでは「打ち合わせ」は修正可能な単位であるため、結果として強調表示を行う範囲は、「打ち合わせ」の範囲に決定される。
【0068】
次に、修正部5は、結果として、「打ち合わせ」の範囲を強調表示部6に通知する。
【0069】
強調表示部6は、表示部4の表示画面に表示された文字列のうち、通知された「打ち合わせ」の文字列を強調表示する。この時の表示画面の一例を、図3(b)に示す。図3(b)に示した表示画面の例では、強調表示82は、文字列を四角の枠で囲んでいる。
【0070】
次に、「本日の打ち合わせは」と音声で入力し、「本日の打ち合わせは」と認識結果が表示されたとする。この場合、単語は、「本日」、「の」、「打ち合わせ」、「は」の計4つであり、修正単位も同じである。ここで、「日の打ち」の部分をテキスト選択したとする。
【0071】
この時の表示部4の表示画面の一例を図4(a)に示す。強調表示部6は、カーソル位置および選択状態として、「日の打ち」であることを修正部5に通知する。
【0072】
修正部5は、テキスト選択91に含まれる修正単位の列を認識結果保持部3より読み込む。この時、「本日」、「の」、「打ち合わせ」が選択範囲にあるものとして読み込まれる。
【0073】
次に、修正部5が、「本日の打ち合わせ」の修正単位列とカーソルの選択状態から修正できる範囲を決定する。ここでは、結果として、修正部5は、「本日の打ち合わせ」の範囲と決定したとする。
【0074】
強調表示部6は、修正部5より修正対象範囲として、「本日の打ち合わせ」の範囲を通知され、表示部4の表示画面に表示されている文字列のうち、「本日の打ち合わせ」の文字列を強調表示する。この時の表示画面の一例を図4(b)に示す。「本日の打ち合わせ」の範囲が強調表示92(この場合輝度反転等)により強調表示される。
【0075】
【発明の効果】
以上説明したように、本発明によれば、下記記載の効果を奏する。
【0076】
本発明の第1の効果は、ユーザは認識単位の境界を容易に把握することができる、ということである。
【0077】
その理由は、本発明においては、ユーザが入力装置によりカーソル移動を行うと、強調表示部がその位置の修正可能な最小単位を強調して表示する、ように構成したためである。
【0078】
本発明の第2の効果は、語句の修正操作を行う前に、ユーザは修正される語句の範囲を把握することができる、ということである。
【0079】
その理由は、本発明においては、ユーザがカーソル移動や範囲指定を行った際に修正対象となる範囲を、修正部が決定し、その結果を強調表示部で強調表示し、実際にユーザが修正操作を行った時には、修正部が、同じ方法で修正範囲を決定して修正操作を行う、ように構成したためである。
【図面の簡単な説明】
【図1】
本発明の一実施例の構成を示すブロック図である。
【図2】
本発明の一実施例の処理フローを示す流れ図である。
【図3】
本発明の一実施例を説明するための図であり、表示部の表示画面の一例を示す図(その1)である。
【図4】
本発明の一実施例を説明するための図であり、表示部の表示画面の一例を示す図(その2)である。
【図5】
従来の音声認識システムの構成を示すブロック図である。
【符号の説明】
1 音声入力装置
2 音声認識部
3 認識結果保持部
4 表示部
5 修正部
6 強調表示部
7 入力装置
 
訂正の要旨 訂正の要旨
請求項6の削除。
異議決定日 2002-02-26 
出願番号 特願平10-145086
審決分類 P 1 651・ 537- YA (G10L)
P 1 651・ 121- YA (G10L)
最終処分 維持  
前審関与審査官 松尾 淳一  
特許庁審判長 谷川 洋
特許庁審判官 石川 伸一
小松 正
登録日 2000-06-30 
登録番号 特許第3082746号(P3082746)
権利者 日本電気株式会社
発明の名称 音声認識システム  
代理人 京本 直樹  
代理人 河合 信明  
代理人 京本 直樹  
代理人 福田 修一  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ