ポートフォリオを新規に作成して保存 |
|
|
既存のポートフォリオに追加保存 |
|
PDFをダウンロード |
審決分類 |
審判 訂正 ただし書き3号明りょうでない記載の釈明 訂正する G10L 審判 訂正 ただし書き2号誤記又は誤訳の訂正 訂正する G10L |
---|---|
管理番号 | 1111837 |
審判番号 | 訂正2004-39247 |
総通号数 | 64 |
発行国 | 日本国特許庁(JP) |
公報種別 | 特許審決公報 |
発行日 | 1989-02-13 |
種別 | 訂正の審決 |
審判請求日 | 2004-11-01 |
確定日 | 2004-12-22 |
訂正明細書 | 有 |
事件の表示 | 特許第2892011号に関する訂正審判事件について、次のとおり審決する。 |
結論 | 特許第2892011号に係る明細書を本件審判請求書に添付された訂正明細書のとおり訂正することを認める。 |
理由 |
1 【請求の要旨】 本件審判の請求の要旨は、特許第2892011号発明(昭和63年6月24日特許出願、平成11年2月26日設定登録)の明細書を審判請求書に添付した訂正明細書のとおり、すなわち、下記(1)、(2)のとおり訂正することを求めるものである。 (1)請求項1を次のとおり訂正する。 「【請求項1】 合成装置で符号化音声情報から音声を再生するため該合成装置に送信する符号化音声情報を発生する方法であって、該音声が複数のフレームからなり、個々のフレームが複数のサンプルをもつ音声ベクトルによって表わされている方法において、 現在の音声ベクトルに応答して目標励振ベクトルを計算するステップ(102); 該目標励振ベクトルとの、オーバラッピング テーブル内に格納されたデータであって、先のフレームからの励振ベクトルにおけるサンプルの線形アレイであるデータをアクセスすることにより生成される複数の候補励振ベクトルの個々に対するエラー値を計算するステップ(106、104);及び 該テーブル内の最も小さなエラー値をもつものとして選択された候補励振べクトルの位置を定義する情報及び該現在の音声ベクトルに対し音声を再生するためのフィル夕係数を送出するステップ(109)とからなり、 該テーブルのアクセスはアクセスされたデータが1つの励振ベクトルとして利用されるサンプルのフルセットを構成しない仮想サーチにおいて継続され、その場合の仮想サーチにおける候補励振ベクトルのグループは励振ベクトルのフルセットを構成するサンプルがない部分にアクセスされたデータの一部をくり返すことにより生成されており、それによって音声における有声領域と無声領域との間の音声遷移の際の応答が改善されている符号化音声情報を発生する方法。」(下線は訂正箇所) (2)請求項7を次のとおり訂正する。 「【請求項7】 合成装置で符号化音声情報から音声を再生するため該符号化音声情報を発生する装置であって、該音声が複数のフレームからなり、個々のフレームが複数のサンプルをもつ音声ベクトルによって表わされている装置において、 現在の音声ベクトルに応答して目標励振ベクトルを計算する手段(102); 該目標励振ベクトルとの、オーバラッピング テーブル内に格納されたデータであって、先のフレームからの励振ベクトルにおけるサンプルの線形アレイであるデータをアクセスすることにより生成される複数の候補ベクトルの個々に対するエラー値を計算する手段(106、104);及び 該テーブル内の最も小さなエラー値をもつものとして選択された候補励振べクトルの位置を定義する情報及び該現在の音声ベクトルに対し音声を再生するためのフィル夕係数を送出する手段(109)を含み、 該テーブルのアクセスはアクセスされたデータが1つの励振ベクトルとして利用されるサンプルのフルセットを構成しない仮想サーチにおいて継続され、その場合の仮想サーチにおける候補励振ベクトルのグールプは励振ベクトルのフルセットを構成するサンプルがない部分にアクセスされたデータの一部をくり返すことにより生成されており、それによって音声における有声領域と無声領域との間の音声遷移の際の応答が改善されている符号化音声情報を発生する装置。」(下線は訂正箇所) 2 【当審の判断】 そこで、これらの訂正事項について検討する。 (1)上記1(1)の訂正事項のうち、 ア 「該目標励振ベクトルをもつオーバラッピング テーブル」を「該目標励振ベクトルとの、オーバラッピング テーブル」とする訂正について、 目標励振ベクトルは、出願当初の明細書11頁16行ないし12頁17行、15頁17行ないし16頁19行の記載によると、現在の音声ベクトルに応答して計算するものであるから、その目標励振ベクトルをオーバラッピングテーブルにもつという表現では、技術的意味が明りょうでないところ、上記訂正によって、目標励振ベクトルをオーバラッピングテーブルがもつものではなく、目標励振ベクトルは、オーバラッピングテーブル内に格納されたデータをアクセスすることにより生成される複数の候補励振ベクトルと比較されるものであることを明らかにしたもので明りょうでない記載の釈明を目的とした訂正に該当する。 そして、このことは出願当初の明細書(11頁16行ないし12頁17行、15頁17行ないし16頁19行、18頁11行〜16行)又は図面に記載された事項の範囲内のものであって、かつ、実質上特許請求の範囲を拡張し、又は変更するものではない。 イ 「目標励振ベクトル」を、「候補励振ベクトル」とする訂正について、 仮想サーチは、出願当初の明細書20頁6行ないし24頁9行の記載によると、最も近似した候補励振ベクトルを探すことであるから、仮想サーチにおいてアクセスされたデータの一部を繰り返すことにより生成されるものは、目標励振ベクトルでなく候補励振ベクトルであることは明らかであり、上記訂正は、誤記の訂正に該当する。 そして、このことは出願当初の明細書(20頁6行ないし24頁9行)又は図面に記載された事項の範囲内のものであって、かつ、実質上特許請求の範囲を拡張し、又は変更するものではない。 (2)上記1(2)の訂正事項のうち、 ア 「該目標励振ベクトルをもつオーバラッピング テーブル」を「該目標励振ベクトルとの、オーバラッピング テーブル」とする訂正について、 上記(1)アで検討したことと同様の理由により、当該訂正は、明りょうでない記載の釈明を目的とした訂正に該当し、出願当初の明細書又は図面に記載された事項の範囲内のものであって、かつ、実質上特許請求の範囲を拡張し、又は変更するものではない。 イ 「目標励振ベクトル」を、「候補励振ベクトル」とする訂正について、 上記(1)イで検討したことと同様の理由により、当該訂正は、誤記の訂正に該当し、出願当初の明細書又は図面に記載された事項の範囲内のものであって、かつ、実質上特許請求の範囲を拡張し、又は変更するものではない。 ウ 「アクセル」を、「アクセス」とする訂正について、 出願当初の明細書18頁14行ないし16行の記載によると、アクセルは、アクセスの単なる誤記であることは明らかである。 そして、このことは出願当初の明細書(18頁14行〜16行)又は図面に記載された事項の範囲内のものであって、実質上特許請求の範囲を拡張し、又は変更するものではない。 以上のように、上記各訂正はいずれも、願書に最初に添付した明細書又は図面に記載された事項の範囲内のものであって、かつ、実質上特許請求の範囲を拡張又は変更するものでない。 また、訂正後における特許請求の範囲に記載されている事項により構成される発明は、訂正前の発明と実質的に変わりがないのであるから、特許出願の際独立して特許を受けることができない発明でもない。 3 【むすび】 したがって、本件審判の請求は、特許法第126条第2号、第3号に掲げる事項を目的とし、かつ、同条第2項ないし第4項の規定に適合する。 よって、結論のとおり審決する。 |
発明の名称 |
(54)【発明の名称】 仮想サーチを用いたコード励振線形予測ボコーダ (57)【特許請求の範囲】 【請求項1】 合成装置で符号化音声情報から音声を再生するため該合成装置に送信する符号化音声情報を発生する方法であって、該音声が複数のフレームからなり、個々のフレームが複数のサンプルをもつ音声ベクトルによって表わされている方法において、 現在の音声ベクトルに応答して目標励振ベクトルを計算するステップ(102); 該目標励振ベクトルとの、オーバラッピング テーブル内に格納されたデータであって、先のフレームからの励振ベクトルにおけるサンプルの線形アレイであるデータをアクセスすることにより生成される複数の候補励振ベクトルの個々に対するエラー値を計算するステップ(106、104);及び 該テーブル内の最も小さなエラー値をもつものとして選択された候補励振ベクトルの位置を定義する情報及び該現在の音声ベクトルに対し音声を再生するためのフィルタ係数を送出するステップ(109)とからなり、 該テーブルのアクセスはアクセスされたデータが1つの励振ベクトルとして利用されるサンプルのフルセットを構成しない仮想サーチにおいて継続され、その場合の仮想サーチにおける候補励振ベクトルのグループは励振ベクトルのフルセットを構成するサンプルがない部分にアクセスされたデータの一部をくり返すことにより生成されており、それによって音声における有声領域と無声領域との間の音声遷移の際の応答が改善されている符号化音声情報を発生する方法。 【請求項2】 該目標励振ベクトルを計算するステップが、該現在の音声ベクトル内のサンプルの数に等しいウィンドウをシフトし該候補励振ベクトルの個々を生成し、これによって、該グループの候補励振ベクトルを生成していること(801)を特徴とする請求項1記載の方法。 【請求項3】 該グループ内に含まれる候補励振ベクトル以外の候補励振ベクトルが全部該テーブルから順にアクセスされたサンプルにて満たされている順次サーチが行われていることを特徴とする請求項1記載の方法。 【請求項4】 該現在の音声ベクトルに応答してフィルタ係数のセットを計算するステップ(101);及び 該現在の音声ベクトルに対する該フィルタ係数に基づいて有限インパルス応答フィルタを生成するためにトエプリッツ(Toeplitz)形式のスペクトル重み付けマトリクスを計算するステップ(103)を含む請求項3記載の方法。 【請求項5】 該目標励振ベクトルを計算するステップが、 該目標励振ベクトル及び選択された励振ベクトルからテンポラリー励振ベクトルを計算するステップ; 該テンポラリー励振ベクトル、該スペクトル重み付けマトリクス及び別のオーバラッピング テーブル内に格納された複数の他の候補励振ベクトルの個々に応答して相互相関値を計算するステップ(705、711); 該テンポラリー励振ベクトル、該スペクトル重み付けマトリクス及び該他の候補励振ベクトルの個々に応答して該他の候補励振ベクトルの個々に対するエネルギー値を反復的に計算するステップ(703、709); 個々の該相互相関値及び該他の候補励振ベクトルの個々に対するエネルギー値に応答して該他の候補励振ベクトルの個々に対するエラー値を計算するステップ(706、712);及び 最も小さなエラー値をもつ他の候補励振ベクトルを選択するステップ(714)を含み; 該送出するステップがさらに該現在の音声ベクトルに対する該音声を再生するために該他のテーブル内の該選択された他の候補励振ベクトルの位置を送出するステップを含むことを特徴とする請求項4記載の方法。 【請求項6】 該仮想サーチ又は該順次サーチが実行されているかどうかを決定するステップ(701)を含み、 該エネルギー値を反復的に計算するステップが順次サーチ(703)においては明細書の式(14)に従って計算を行い、そして仮想サーチ(705)においては明細書の式(15)に従って計算をしていることを特徴とする請求項5に記載の方法。 【請求項7】 合成装置で符号化音声情報から音声を再生するため該符号化音声情報を発生する装置であって、該音声が複数のフレームからなり、個々のフレームが複数のサンプルをもつ音声ベクトルによって表わされている装置において、 現在の音声ベクトルに応答して目標励振ベクトルを計算する手段(102); 該目標励振ベクトルとの、オーバラッピング テーブル内に格納されたデータであって、先のフレームからの励振ベクトルにおけるサンプルの線形アレイであるデータをアクセスすることにより生成される複数の候補励振ベクトルの個々に対するエラー値を計算する手段(106、104);及び 該テーブル内の最も小さなエラー値をもつものとして選択された候補励振ベクトルの位置を定義する情報及び該現在の音声ベクトルに対し音声を再生するためのフィルタ係数を送出する手段(109)を含み、 該テーブルのアクセスはアクセスされたデータが1つの励振ベクトルとして利用されるサンプルのフルセットを構成しない仮想サーチにおいて継続され、その場合の仮想サーチにおける候補励振ベクトルのグループは励振ベクトルのフルセットを構成するサンプルがない部分にアクセスされたデータの一部をくり返すことにより生成されており、それによって音声における有声領域と無声領域との間の音声遷移の際の応答が改善されている符号化音声情報を発生する装置。 【請求項8】 該現在の音声ベクトルに応答してフィルタ係数のセットを決定するための手段(101); 該フィルタ係数のセットから有限インパルス応答フィルタを表わす情報を計算するための手段(103); 該候補励振ベクトルと該目標励振ベクトルの各々における有限インパルス応答フィルタ情報に応答して、該仮想サーチにおいて生成された複数の候補励振ベクトルの各々に対するエラー値を反復的に計算する手段(708、709、710、711、712);及び 最も小さなエラー値をもつ該候補励振ベクトルを選択するための手段(714)を含むことを特徴とする請求項7記載の装置。 【発明の詳細な説明】 (技術分野) 本発明は音声の低ビット速度符号化及び準号、より詳細には、高い性能を与える改良された符号励振線形ボコーダに関する。 (発明の背景) コード励振線形予測符号化(code excited linear predictive coding,CELP)は周知の技術である。この符号化技術は音声を線形予測(linear predictive,LPC)フィルタを励振するのに符号化された励振情報を用いて合成している。この励振は候補励振ベクトルのテーブルを1フレーム毎に捜すことによって見つけられる。コードブックとも呼ばれるこのテーブルはその要素が一続きの励振サンプルであるベクトルから構成される。個々のベクトルは1つのフレーム内に存在する音声サンプルと同数の励振サンプルを含む。このコードブックはオーバラッピング テーブルとして構成され、励振ベクトルは励振サンプルの線形アレイに沿ってウィンドウをシフトすることによって定義される。LPCフィルタを決定するために入力音声に関してLPC分析が遂行される。この分析は最初のLPCフィルタを得るために音声フレームに関してLPC分析を行なうことによって遂行され、次にこのフィルタがコードブック内のさまざまな候補ベクトルによって励振される。最良の候補がこの対応する合成出力が入力音声といかに一致するかに基づいて選択される。最良の候補が見つけられたら、最良のコードブックエントリーを定義する情報及びフィルタがシンセサイザーに送られる。シンセサイザーは類似のコードブックをもち、そのコードブック内の指定されるエントリーにアクセスし、これを用いて同じLPCフィルタを励振する。これに加えて、これはコードブックを音声に適応させるために最良の候補励振ベクトルを用いてコードブックを更新する。 この方法の問題点はコードブックが、例えば、音声の音声領域から音声領域の音声の遷移の際に非常にゆっくりと適応することがある。音声の有声流域は音声内に基本振動数が存在することを特徴とする。この問題は、特に女性に顕著であり、これは女性によって生成される基本振動数が男性のものより高いためである。 (発明の概要) この問題の解決及び技術上の向上が、例えば、音声の無声領域から有声領域への遷移のような音声遷移の間の応答を向上させるために候補励振ベクトルを含むコードブックの仮想サーチを用いるボコーダによって達成される。本発明による方法は、音声をフレームにグループ化するステップ、現フレームのサンプルとテーブル内に格納された励振情報の候補セットとを現音声に最もマッチする候補セットを決定するために個々のグループの候補セットの第1の部分を情報の該グループの候補セットの個々の第2の部分に反復的に加えることによって比較するステップ、このテーブル内の最もマッチする候補セットの位置を決定するステップ、及びデコーダによるこの音声の再生のためにこの位置情報を送出するステップを含む。 この比較ステップは、励振情報の候補セットをサンプルの線形アレイとしてテレブル内に格納するステップ、個々の候補セット内のサンプルの数に等しいウィンドウをこのアレイを通じてシフトして励振情報の候補セットを生成し、その中に十分なサンプルが存在しないグループに対する線形アレイの終端に向かってグループの候補セットを生成し、このグループの候補セットの第2の部分を満たすステップ、及びグループの個々の候補セットの第1の部分をそのグループの個々の第2の部分内に反復して加えることによってグループの個々を完結するステップを含む。また、ウィンドウをそのグループの部分以外の線形アレイを通じてシフトすることによって得られる他の候補セットは全部このテーブルからの順次サンプルにて満たされる。 この比較ステップはさらに音声の現フレームに応答して励振情報の目標セットを生成するステップ、目標セット及び励振情報の最もマッチしたセットから励振情鞭のテンポラリーセットを計算するステップ、励振情報のテンポラリーセットをもつ別の候補セットに対する別のテーブルをサーチしてこの別のテーブルからこのテンポラリー励振セットに最もマッチする候補セットを決定するステップ、この別のテーブル内の最もマッチする候補セットの別の位置が決定するステップを含み、送出ステップがさらに音声の再生のためにこの別の位置情報を送出するステップを含む。 これに加えて、比較ステップはさらに、現音声フレームに応答してフィルタ係数を決定するステップ、セットのフィルタ係数から有限インパルス応答フィルタ情報を計算するステップ、有限インパルス応答フィルタ情報及び励振情報の目標セットに応答してテーブル内に格納された候補セットの個々に対するエラー値を反復的に計算するステップ、及びそれが最も小さなエラー値をもつことに基づいて最良の候補セットを選択するステップを含む。また、送出ステップはさらに音声の再生のためにフィルタ係数を送出するステップを含む。 本発明の装置はテーブル内の励振情報の複数の候補セットを通じて音声の呪フレームに対するサンプルに最もマッチする候補セットをグループの候補セットの個々のセットの第1の部分をそのグループの個々の候補セットの第2の部分に反復的に加えることにより決定するためのサーチャー回路を含む。さらに、この共置はデコーダによる音声の再生のためにテーブル内の最もマッチする候補セットの位置を同定する情報を送出するためのエンコーダを含む。 (実施例) 第1図は本発明の主題であるボコーダ(vocoder)をブロック図形式にて示す。要素101から112はボコーダのアナライザー部分を示し、一方、要素151から157はボコーダのシンセサイザー部分を表わす。第1図のアナライザー部分は経路120上に受信された入り音声に応答してアナログ音声をデジタルサンプルにデジタル的にサンプリングし、これらデジタルサンプルを周知の技術を用いてフレームにグループ化する。個々のフレームに対して、アナライザー部分は声帯のフォーマント特性を表わすLPC係数を計算し、そのフレームに対する音声を最も良く近岨する確率的コードブック105及び適当コードブック104の両方からのエントリーをスケーリング係数とともに捜す。このエントリー及びスケーリング情報はアナライザー部分によって決定される励振情報を定義する。 この励振及び係数情報が次にエンコーダ109によって経路145を介して第1図に示されるボコーダのアナライザー部分に送られる。確率的発生器153及び適応的発生器154はコードブックエントリー及びスケーリング係数に応答して、ボコーダのアナライザー部分内で計算された励振情報を再生し、この励振情報を用いてアナライザー部分から受信されるLPC係数によって決定されるLPCフィルタを音声を再生するために励振する。 次に、第1図のアナライザー部分の機能をより詳細に述べる。LPCアナライザー101は入り音声に応答して周知の技術を用いてLPC係数を決定する。これらLPC係数は目標励振計算器102、スペクトル重み付け計算器103、エンコーダ109、LPCフィルタ110、及びゼロ入力応答フィルタ111に送られる。エンコーダ109は、LPC係数に応答してこれら係数を経路145を介してデコーダ151に送る。スペクトル重み付け計算器103はこれら係数に応答して重要な音声内容をもつことが知られている音声の部分を強調するマトリクスの形式でスペクトル重み付け情報を計算する。このスペクトル重み付け情報は有限インパスル応答LPCフィルタに基づく。この有限インパルス応答フィルタの使用はサーチャー(searcher)106及び107内で遂行される計算を遂行するために必要な計算の数を大きく削減する。このスペクトル重み付け情報はサーチャーによってコードブック104及び105からの励振情報に対する最良候補を決定するために用いられる。 ターゲット励振計算器102はサーチャー106及び107が近似を試みるターゲット励振を計算する。このターゲット励振はアナライザー101によって入り信号から前のフレームに対する励振及びLPCフィルムの影響を引くことによって計算されたLPC係数に基づいて重み付けフィルタを回施させることによって計算される。前のフレームに対する後者の影響はフィルタ110及び111によって計算される。前のフレームに対する励振及びLPCフィルタを考慮しなくてはならない理由は、これら係数が、通常、LPCフィルタのリンギングとして知られる現フレーム内の信号成分を生成するためである。後に説明されるごとく、フィルタ110及び111はLPC係数及び前のフレームから計算された励振に応答してこのリンギング信号を決定し、これを経路144を介して引き算器112に送る。引き算器112は後者の信号及び現在の音声に応答して現在の音声からこのリンギング信号を引いた残留信号を計算する。計算器102はこの残留信号に応答してターゲット励振情報を計算し、この情韓を経路123を介してサーチャー106及び107に送る。 サーチャーは合成励振とも呼ばれる計算励振を順次計算する。この計算励振はコードブックインデックス及びスケーリング係数の形式でエンコーダ109及び経路145を介して第1図のシンセサイザー部分に送られる。個々のサーチャーは計算励振の部分を計算する。第1に、適応的サーチャー106は励振情報を計算し、これを経路127を介して確率的サーチャー107に送る。サーチャー107は経路123を介して受信された目標励振及び適応的サーチャー06からの励振情報に応答して計算器102によって計算された目標励振を最も良く近似する計算励振の残りの部分を計算する。サーチャー107は計算されるべきこの残留励振(remaining excitation)を目標励振サーチャー106によって決定される励振を引くことによって決定する。サーチャー106及び107によって決定される計算あるいは合成励振はそれぞれ経路127及び126を介して加算器108に送られる。加算器108はこの2つの励振成分を一緒に加えることによって現フレームに対する合成励振を計算する。この合成励振骸合シンセサイザーによって合成音声を生成するために用いられる。 加算器108の出力も経路128を介してLPCフィルタ110及び適応的コードブック104に送られる。経路128を介して送られる励振情報は適応的コードブック104を更新するのに用いられるコードブックインデックス及びスケーリング係数はサーチャー106及び107からエンコーダ109にそれぞれ経路125及び124を介して送られる。 サーチャー106は適応的コードブック104内に格納されたセットの励振情報にアクセスし、個々のセットの情報を用いて経路123を介して受信された目標励振とコードブック104からのアクセスされたセットの励振との間のエラー基準を最小にする。適応的コードブック104内に格納された情報は人の音声の動的レンジ内での変動を許さないため個々のアクセスされたセットの情報に対してもスケーリング係数が計算される。 用いられるエラー基準は元の音声と合成音声との間の差の平方である。合成音声は第1図のシンセサイザー部分内でLPCフィルタ117の出力の所に再生される音声である。この合成音声はコードブック104から得られる合成励振及びリンギング信号から計算され、音声信号は目標励振及びリンギング信号から計算される。合成音声に対する励振情報は、マトリクスにて表現された計算器103からの重み付け情報を用いていてシンセサイザー102によってLPCフィルタのたたみ込みを遂行するのに用いられる。コードブック104から得られた個々のセットの情報に対してエラー基準が評価され、最も低いエラー値を与える励振情報のセットが現フレームに対して用いられる。 サーチャー106がスケーリング係数とともに使用されるべきセット励振情報を決定した後、コードブックへのインデックス及びスケーリング係数が経路125を介してエンコレダ109に送られ、励振情報も経路127を介して確率的サーチャー107に送られる。確率的サーチャー107は経路123を介して受信された目標励振から適応的サーチャー106からの励振情報を引く。確率的サーチャー107は次に適応的サーチャー106によって遂行されるのと類似の動作を遂行する。 適応的コードブック104内の励振情報は前のフレームからの励振情報である。個々のフレームに対して、この励振情報はサンプリングされた元の音声と同数のサンプルから成る。好ましくは、この振動情報は4.8Kbps伝送速度に対して55個のサンプルを含む。このコードブックはプッシュダウンリストとして編成され、新たなセットのサンプルがコードブックの中にプッシュされコードブック内の最も古いサンプルと置換される。コードブック104からのセットの励振情報を使用する場合、サーチャー106はこれらセットの情報をばらばらなセットのサンプルとして扱うのでなく、コードブック内のサンプルを励振サンプルの線形アレイとして扱う。例えば、個々のサーチャー106は情報の第1の候補セットをコードブック104からのサンプル1からサンプル55を用いて生成し、情報の第2のセットの候補をコードブックからのサンプル2からサンプル56を用いて生成する。このタイプのコードブック検索は通常オーバラップコードブックと呼ばれる。 この線形サーチング技術がコードブック内のサンプルの終わりに達すると、使用されるべきフルセットの情報が存在しなくなる。1つのセットの情報はまた励振ベクトルとも呼ばれる。この時点で、サーチャーは仮想サーチ(virtual seaech)を遂行する。この仮想サーチにおいてはテーブルからアクセスされた情報がそれに対してテーブル内にサンプルが存在しないセットの後の部分に反復して入れられる。この仮想サーチ技術を用いることによって、適応的サーチャー106が音声の無声領域(unvoiced region)から音声の有声領域(voiced region)への遷移により迅速に応答することが可能となる。これは無声領域内では励振ベクトルがホワイトノイズに類似し、一方、有声領域内では基本振動数が存在するためである。いったん基本振動数の部分がコードブックから同定されると、これが反復される。 第2図はコードブック104内に格納されるであろう励振サンプルの一部を示すが、ここでは、説明の目的上、励振セット当たり10個のみのサンプルが想定される。ライン201はコードブックの内容を図解し、ライン202、203及び204は仮想サーチ技術を用いて生成された励振セットを図解する。ライン202に示される励振セットはコードブックのサーチをライン201上のサンプル205から開始することによって生成される。サンプル205から開始すると、テーブル内には9個のみのサンプルが存在し、従ってサンプル208がライン202に示される励振セットの10番目のサンプルを形成するためにサンプル209としては反復される。ライン202のサンプル208はライン201のサンプル205に対応する。ライン203はライン201上のサンプル206から開始して生成されたライン202に示される励振セットに続くセットを図解する。サンプル206から開始すると、コードブック内には8個のみのサンプルが存在し、サンプル210としてグループ化されたライン203の最初の2つのサンプルがライン203にサンプル211として示される励振セットの終端に反復される。ライン203に示される有効ピークがピッチピークである場合は、このピッチがサンプル210及び211内で反復されることは当業者によって容易に理解できることである。ライン204はコードブック内のサンプル207から開始して生成された第3の励振セットを図解する。図解されるごとく、212として示される3つのサンプルがライン204上に示される励振セットの終端にサンプル213として反復される。ライン201内に207として示される初期ピッチピークは、個々のフレームの終わりにコードブック104の内容が更新されるため、前のフレームからサーチャー106及び107によって遂行されるサーチの累積であることに注意する。 統計的サーチャー107は、通常は、無声領域から有声領域に入ると同時に最初にピッチピーク、例えば、207に到達する。 確率的サーチャー107は適応的サーチャー106と類似に機能をもつが、これらが目標励振として、目標励振計算器102からの目標励振とサーチャー106によって発見された最良マッチを代表する励振との間の差を用いる点が異なる。これに加えて、サーチャー107は仮想サーチは遂行しない。 次に第1図のアナライザー部分の詳細な説明を行なう。この説明はマトリクス及びベクトル代数に基づく。 目標励振計算器102は目標励振ベクトルtを以下のように計算する。音声ベクトルsは以下のように表わすことができる。 s=Ht+z HマトリクスはLPCアナライザー101を介して経路121から受信されるLPC係数によって定義されるオールポールLPC合成フィルタ(all-pole LPC合成フィルタ)を表わす。Hによって表されるこのフィルタの構造は後に詳細に説明され、本発明の目的の一部を構成する。ベクトルzは前のフレームの最中に受信された励振からのオール ポール フィルタのリンギングを表わす。前述のごとく、ベクトルzはLPCフィルタ110及びゼロ入力応答フィルタ111から派生させる。計算器102及び引き算器112は目標励振を表わすベクトルtをベクトルsからベクトルzを引き、この結果としての信号ベクトルをオールゼロLPC合成フィルタ(all-zero LPC合成フィルタ)を通じて処理する。このオール ゼロ合成フィルタはLPCアナライザー101によって生成されたLPC係数から派生され、経路121を介して送られる。目標励振ベクトルtは、重み付けフィルタとも呼ばれるオール ゼロLPC合成フィルタのたたみ込み演算(convolution operation)を遂行することによって得られ、差信号は元の音声からリンギングを引くことによって発見される。このたたみ込みは周知の信号処理技術を用いて遂行される。 適応的サーチャー106は目標励振ベクトルtに最もマッチする候補励振ベクトルrを見つけるために適応的コードブック104をサーチする。ベクトルrはまたセットの励振情報とも呼ばれる。最良のマッチを決定するために用いられるエラー基準は元の音声と合成音声の間の差の平方である。元の音声はベクトルsによって与えられ、合成音声は以下の式によって計算されるベクトルyによって与えられる。 y=HLiri+z ここで、Liはスケーリング係数である。 このエラー基準は以下の形式によって書き表わすことができる。 e=(Ht+z-HLiri-z)T(Ht+z-HLiri-Z) (1) このエラー基準においては、Hマトリクスが感覚液に重要なスペクトルのセクションを強調するように修正される。これは周知のビールバンド幅ワインディング技術(pole-bandwidth widing technique)を用いて達成される。式(1)は以下の形式に書き直すことができる。 e=(1-HLiri)THTH(t-HLiri) (2) 式(2)はさらに以下のように整理することができる。 e=tTHTHt+HLiriTHTHHLiri-2HLiriTHTHt (3) 式(3)の第1の項は任意のフレームに対してコンスタントであり、コードブック104からのどのriベクトルを用いるかの決定においてエラーの計算から落とされる。コードブック104内のri励振ベクトルの個々に対して、式(3)を解き、エラー基準eを最も低い値のeをもつriベクトルが選択されるように決定すべきである。式(3)が解く前に、スケーリング係数Liを決定することが必要である。これはLiに対して部分導関数(partial derivative)を取り、これをゼロにセットすることによって簡単に遂行でき、これは以下の式を与える。 式(4)の分子は、通常、相互相関項と呼ばれ、分母はエネルギー項と呼ばれる。このエネルギー項は相互相関項より多くの計算を必要とする。この理由は相互相関項では1つのベクトルを得るために1フレーム当たり最後の3つの要素の積のみの計算が要求され、次に個々の新たなベクトルriに対して、単に移項(トランスポーズ)された候補ベクトルとこの相互相関項の最後の3つの要素の計算結果としてのコンスタントベクトルとの間のドット積を取ることのみが必要であるためである。 エネルギー項の場合は、最初にHriを計算し、次にこのトランスポーズを取り、次にHriとHriのトランスポーズの間の内積(inner product)を取ることが要求される。これは結果として多数のマトリクス及びベクトル演算となり、多数の計算を必要とする。本発明は計算の数を削減し、結果としての合成音声を向上させることを目的とする。 一部、本発明はこの目的を先行技術において用いられる無限インパルス応答LPCフィルタのかわりに有限インパルス応答LPCフィルタを用いることによって達成する。コンスタントの応答長をもつ有限インパルス応答フィルタは先行技術によるのと異なる対称性をもつHマトリクスを与える。Hマトリクスはマトリクス表貌で有限インパルス応答フィルタの演算を表わす。フィルタが有限インパルス応答フィルタであるため、このフィルタと個々のベクトル=によって表わされる励振情報のたたみ込みはサンプルのR番号によって表わされる有限数の応答サンプルを生成するベクトルriの個々のサンプルを与える。たたみ込み演算であるHri計算のマトリクスベクトル演算が遂行されると、候補ベクトルri内の個々のサンプルからの全てのR応答ポイントが1つに総和され、合成音声のフレームが生成される。 有限インパルス応答フィルタを表わすHマトリクスはN+R×Nマトリクスであり、ここで、Nはサンプル内のフレーム長を表わし、そしてRは複数のサンプル内の切捨てインパルス応答の長さである。Hマトリクスのこの形式を用いると、応答ベクトルHrはN+Rの長さをもつ。Hマトリクスのこの形式は以下の式(5)によって表わされる。 以下の式(6)にて表わされるHマトリクスのトランスポーズ(transpose)とHマトリクス自体の積を考慮する A=HTH (6) 式(6)はマトリクスAを与えるが、これは以下の式(7)によって表わされるようにN×N平方対称トエプリッツ(Toeplitz)である。 式(7)はNが5のときHTH演算から得られるAマトリクスを表わす。式(5)からRの値によってはマトリクスA内の幾っかの要素が0となることがわかる。例えば、R=2の場合、要素A2、A3及びA4は0である。 第3図はこのベクトルが5つのサンプルを含む、つまり、N=5の場合の第1の候補ベクトルr1に対するエネルギー項を示す。サンプルX0からX4は適応的コードブック104内に格納された最初の5つのサンプルである。第2の候補ベクトルr2に対する式(4)のエネルギー項の計算が第4図に示される。後者の数字は候補ベクトルのみが変わり、また変化はX0サンプルの削除及びX5サンプルの追加のみを伴うことを示す。 第3図に示されるエネルギー項の計算はスケーラー値(scalar value)を与える。riに対するこのスケーラー値は第4図に示される候補ベクトルr2に対するスケーラー値をX5サンプルが加わり、X0サンプルが削除されている点のみが異なる。有限インパルス応答フィルタの使用に起因して導入される対称性及びトエプリッツ(Toeplitz)特性による第4図に対するスケーラー値は以下の方法にて簡単に計算できる。第1に、X0サンプルからの寄与がこの寄与が第5図に示されるように簡単に決定できることを認識することにより削除される。この寄与は、これが単に項501と項502を巻きこむ掛け算及び加算演算及び項504と項503を巻き込む掛け算及び加算演算のみに基づくために削除できる。同様に、第6図は、項X5の追加がこの寄与が項601と602を巻き込む演算及び項604と項603を巻き込む演算に起因することを理解することにより、スケーラー値に加えることができることを図解する。第5図に示される項の寄与を引き、第6図に示される項の影響を加えることにより、第4図に対するエネルギー項は第3図のエネルギー項から反復計算することができる。当業者においては、反復計算のこの方法がベクトルriあるいはAマトリクスのサイズを独立したものであることは明白である。この反復計算は適応的コードブック104あるいはコードブック105内に含まれる候補ベクトルを互いに比較することを可能とし、これにはコードブックから取られる個々の新たな励振ベクトルに対して第5図及び第6図に示される追加の演算のみが要求される。 より一般的には、これら反復計算は数学的に以下のように表現できる。第1に、セットのマスキング マトリックスがIkとして定義される。ここで、最後の1つはK番目の列(row)に現れる。 これに加えて、単位マトリクスが以下のようにIとして定義される。 さらに、シフティング マトリクスが以下のように定義される。 トエプリッツ(Toeplitz)マトリクスに対しては、以下の周知の定理が当てはまる。 STAS=(I-I1)A(I-I1) (11) AあるいはHTHがトエプリッツであるため、エネルギー項に対する反復計算は以下の表記法によって表現できる。第1に、rj+1ベクトルと関連するエネルギー項を以下のようにEj+1と定義する。 Ej+1=rTj+1HTHrj+1 (12) これに加えて、ベクトルは新たなサンプルを含むベクトルrj+1と結合されたrjのシフトされたバージョンとして以下のように表わすことができる。 rj+1=Srj+(I-In-1)rj+1 (13) 式(11)の定理を用いてシフト マトリクスSを削除すると、式(12)は以下の形式に書き直すことができる。 Ej+1=Ej+2[rTj+1(I-IN-1)HTHSrj-rTj(I-I1)HTHI1rj]rTjI1HTHI1rj+rTj+1(I-IN-1)HTH(I-IN-1)rj+1 (14) 式(14)から、I及びSマトリクスはいくつかの▲1▼を服務が0が体制を占めるため、式(14)の値を求めるのに必要とされる計算の式は式(3)に要求される計算量より大きく低減されることが明らかである。詳細な分析を行うと、式(14)の計算は2Q+4浮動小数点の演算の小さい方のどちらかである。これは式(3)に要求される計算の数と比較して大きな簡素化である。この計算の簡素化は無限インパルス応答フィルタでなく有限インパルス応答フィルタを用いることにより、またHTHマトリクスのトエプリッツ(Toeplitz)特性によって達成される。 式(14)はコードブック104の通常のサーチにおいてはエネルギー項を正しく計算する。ただし、いったん仮想サーチングが開始されると、式(14)はもはやエネルギー項を正確に計算しなくなる。これは第2図のライン204上のサンプル213によって図解される仮想サンプルが2倍の速度で変化するためである。これに加えて、第2図のサンプル214によって図解される通常のサーチのサンプルが励振ベクトルの真ん中で変化する。この状況はコードブック内の実際のサンプル、例えばサンプル214をベクトルwiにて表わし、仮想セクション内のサンプル、例えば、第2図のサンプル213をベクトルviによって表わすことによって仮想法にて解決できる。これに加えて、仮想サンプルが総励振ベクトルの半分以下に制限される。エネルギー項はこれら条件を用いて式(14)から以下のように書き直すことができる。 Ei=wiTHTHwi+2vTiHTHwi+vTiHTHvi (15) 式(15)第1及び第3の項は以下の方法で計算的に整理できる。式(15)の第1の項に対する反復は以下のように書き変えることができる。 wTj+1HTHwj+1=wTjHTHwj-2wjT(I-Ii)HTHI1wj-wTjHTHI1wj (16) そして、vjとvj+1の間の関係は以下のように書くことができる。 vj+1=S2(I-Ip+1)vj+(I-IN-2)vj+1 (17) これは、式(15)の第3の項を以下を用いて整理することを可能とする。 HTHvj+1=S2HTHvj+HTHS2(IpIp+1)vj+(I-IN-2)HTHS2(I-Ip+1)vj+(I-IN-2) (18) 変数pは現存の励振ベクトル内で現在用いられているコードブック104内に実際に存在するサンプルの数である。サンプルの数の一例が第2図のサンプル214によって与えられる。式(15)の第2の項は式(18)によって整理することができる。これは、viTHTが単にマトリックス演算のHTHviのトランスポーズであるためである。当業者においては、実際のコードブック サンプルと仮想サンプルのサーチとの間ではサーチの速度が異なることは一目瞭然である。上に示される例では、仮想サンプルは実際のサンプルの2倍の速度にてサーチされる。 第7図は第1図の適用的サーチャー106をより詳細に示す。前述のごとく、適応的サーチャー106は2つのタイプのサーチ動作、つまり、仮想サーチと順次サーチの2つを遂行する。順次サーチ動作においては、サーチャー106は適応的コードブック104からの1つの完全な候補励振ベクトルにアクセスし、一方、仮想サーチにおいては、適応的サーチャー106はコードブック104からアクセスされた候補ベクトルの最初の部分を第2図に示されるようにこの候補励振ベクトルの後の部分に反復して入れる。仮想サーチ動作はブロック708からブロック712によって遂行され、順次サーチ動作はブロック702から706によって遂行される。サーチ ディターミネータ701は仮想サーチを遂行すべきか順次サーチを遂行すべきかを決定する。候補セレクタ714は、コードブックが完全にサーチされたか調べ、コードブックが完全にサーチされていない場合は、セレクタ714は制御をサーチ ディターミネータ701に戻す。 サーチ ディターミネータ701は経路122を介して受信されるスペクトル重み付けマトリクス及び経路123を介して受信される目標励振ベクトルに応答して完全なサーチコードブック104を管理する。候補ベクトルの第1のグループは全部コードブック104から満たされ、必要な計算がブロック702から706によって遂行され、候補励振ベクトルの第2のグループはブロック708から712によって扱われ、ベクトルの部分が反復される。 候補励振の第1のグループがコードブック104からアクセスされている場合は、サーチ ディターミネータは目標励振ベクトル、スペクトル重み付けマトリクス、及びアクセスされるべき候補励振ベクトルのインデックスを経路727を介して順次サーチ コントロール702に送る。コントロール702は候補ベクトルインデックスに応答してコードブック104にアクセスする。順次サーチコントロール702は次に目標励振ベクトル、スペクトル重み付けマトリクス、インデックス、及び候補励振ベクトルを経路728を介してブロック703及び704に送る。 ブロック704は経路728を介して受信された第1の候補励振ベクトルに応答して式(3)のHTHt項に等しいテンポラリー ベクトル(temporary vector)を計算し、このテンポラリー ベクトル及び経路728を介して受信された情報を経路729を介して相互相関計算器705に送る。第1の候補ベクトルの後に、ブロック704は経路728上に受信された情報を経路729に送る。計算器705は式(3)の相互相関項を計算する。 エネルギー計算器703は経路728上の情報に応答して式(14)によって示される演算を遂行することによって式(3)のエネルギー項を計算する。計算器703はこの値を経路733を介してエラー計算器706に送る。 エラー計算器706は経路730及び733を介して受信された情報に応答してエネルギー値と相互相関値を加えることによってエラー値を計算し、このエラー値を候補番号、スケーリング係数、及び候補値とともに経路730を介して候補セレクタ714に送る。 候補セレクタ714は経路732を介して受信された情報に応答してそのエラー値が最も低い候補の情報を保持し、経路732を介して起動されると経路731を介して制御をサーチ ディターミネータ701に送る。 サーチ ディターミネータ701が候補ベクトルの第2のグループがコードブック104からアクセスされるべきことを知ると、これは目標励振ベクトル、スペクトル重み付けマトリクス、及び候補励振ベクトルインデックスを経路720を介して仮想サーチ コントロール708に送る。サーチ コントローラ708はコードブック104にアクセスし、アクセスされたコード励振ベクトル及び経路720を介して受信された情報を経路721を介してブロック709及び710に送る。ブロック710、711及び712は、経路722及び723を介してブロック704、705及び706によって遂行されるのと同一タイプの演算を遂行する。ブロック709はブロック703と同様に式(3)のエネルギー項を求める演算を遂行する。ただし、ブロック709はエネルギー計算器703の湯合は式(14)を用いるのに反して式(15)を用いる。 個々の候補ベクトル インデックス、スケーリング係数、候補ベクトル、及び経路724を介して受信されるエラー値に対して、候補セレクタ714は候補ベクトル、スケーリング係数、及び最も低いエラー値をもつベクトルのインデックスを保持する。候補ベクトルの全てが処理された後、候補セレクタ714は最も低いエラー値をもつ選択された候補ベクトルのインデックス及びスケーリング係数を経路125を介してエンコーダ109に送り、選択された励振ベクトルを経路127を介して加算器108、そして経路127を介して確率的サーチャー107に送る。 第8図は仮想サーチ コントロール708をより詳細に示す。適応的コードブックアクセス801は経路720を介して受信させた候補インデックスに応答して、コードブック104にアクセスし、アクセスされた候補励振ベクトル及び経路720を介して受信された情報を経路803を介してサンプル リピータ802に送る。サンプル リピータ802は候補ベクトルに応答して、1つの完全な候補ベクトルを得るために候補ベクトルの最初の部分を候補ベクトルの最後の部分に反復して入れる。こうして得られた完全な候補励振ベクトルが次に経路721を介して第7図のブロック709及び710に送られる。 第9図はエネルギー計算器901の式(18)によって示される演算を遂行するための動作をより詳細に示す。実際のエネルギー成分計算器901は式(18)の第1の項によって要求される演算を遂行し、この結果を経路911を介して加算器905に送る。テンポラリー仮想ベクトル計算器902は項HTHviを式(18)に従って計算し、この結果を経路721を介して受信された情報とともに経路910を介して計算器903及び904に送る。経路910上の情報に応答して、混合エネルギー成分計算器903は式、(15)の第2の項によって要求される演算を遂行し、この結果を経路913を介して加算器905に送る。経路910上の情報に応答して、仮想エネルギー成分計算器904は式(15)の第3の項によって要求される演算を遂行する。加算器905は経路911、912、及び913上の情報に応答してエネルギー値を計算し、この値を経路726上に送る。 統計的サーチャー107は第7図に示されるブロック701から706及び714と類似するブロックを含む。ただし、サーチ ディターミネータ701は経路123を介して受信された目標励振から経路127を介して受信された選択された候補励振ベクトルを引くことによって第2の目標励振ベクトルを形成する。これに加えて、常にディターミネータは制御をコントローラ702で送る。 上に説明の実施態様は単に本発明の原理を図解するものであり、本発明の精神及び範囲から逸脱することなく他の構成を設計できることは明白である。 【図面の簡単な説明】 第1図は本発明の主題であるボコーダのアナライザー及びシンセサイザーセクションをブロック図で形成で示し; 第2図は本発明の主題である仮想サーチ技法を用いてのコードブック104からの励振ベクトルの生成をグラフ形式で示し; 第3図から第6図は最良候補ベクトルを選択するために用いられるベクトル及びマトリクス演算をグラフ形式で示し; 第7図は第1図の適応的サーチャー106をより詳細に示し; 第8図は第7図の仮想サーチ コントロール708をより詳細に示し;そして 第9図は第7図のエネルギー計算器709をより詳細に示す。 (主要部分の符号の説明) 101‥‥‥LPCアナライザー 102‥‥‥目標励振計算器 103‥‥‥スペクトル重み計算器 104‥‥‥適応コードブック |
訂正の要旨 |
審決(決定)の【理由】欄参照。 |
審決日 | 2004-12-10 |
出願番号 | 特願昭63-155116 |
審決分類 |
P
1
41・
853-
Y
(G10L)
P 1 41・ 852- Y (G10L) |
最終処分 | 成立 |
前審関与審査官 | 新宮 佳典、河口 雅英 |
特許庁審判長 |
杉山 務 |
特許庁審判官 |
高瀬 勤 橋本 恵一 |
登録日 | 1999-02-26 |
登録番号 | 特許第2892011号(P2892011) |
発明の名称 | 仮想サーチを用いたコード励振線形予測ボコーダ |
代理人 | 朝日 伸光 |
代理人 | 高橋 誠一郎 |
代理人 | 臼井 伸一 |
代理人 | 加藤 伸晃 |
代理人 | 高橋 誠一郎 |
代理人 | 越智 隆夫 |
代理人 | 加藤 伸晃 |
代理人 | 高梨 憲通 |
代理人 | 産形 和央 |
代理人 | 吉澤 弘司 |
代理人 | 越智 隆夫 |
代理人 | 松井 孝夫 |
代理人 | 松井 孝夫 |
代理人 | 本宮 照久 |
代理人 | 藤野 育男 |
代理人 | 産形 和央 |
代理人 | 吉澤 弘司 |
代理人 | 岡部 正夫 |
代理人 | 高梨 憲通 |
代理人 | 朝日 伸光 |
代理人 | 藤野 育男 |
代理人 | 岡部 正夫 |
代理人 | 本宮 照久 |
代理人 | 臼井 伸一 |