• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 4項4号特許請求の範囲における明りょうでない記載の釈明 取り消して特許、登録 G10L
審判 査定不服 2項進歩性 取り消して特許、登録 G10L
管理番号 1285091
審判番号 不服2013-6716  
総通号数 172 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2014-04-25 
種別 拒絶査定不服の審決 
審判請求日 2013-04-11 
確定日 2014-03-11 
事件の表示 特願2010-531210「MDCTスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング」拒絶査定不服審判事件〔平成21年 4月30日国際公開、WO2009/055493、平成23年 1月13日国内公表、特表2011-501828、請求項の数(40)〕について、次のとおり審決する。 
結論 原査定を取り消す。 本願の発明は、特許すべきものとする。 
理由 第1 手続の経緯
本願は、2008年10月22日(パリ条約による優先権主張外国庁受理2007年10月22日、2008年10月21日、米国)を国際出願日とする出願であって、原審において平成22年6月24日付けで手続補正がされ、平成24年4月9日付けで拒絶理由が通知され、同年12月5日付けで拒絶査定がなされ、これに対し、平成25年4月11日に拒絶査定不服の審判が請求されるとともに、同日付けで手続補正がされ、同年6月27日付けで当審より審尋がなされたが、回答書が提出されず期間経過となったものである。

第2 平成25年4月11日付けの手続補正(以下、「本件補正」という。)の適否
1.補正の内容
上記手続補正は補正前の平成22年6月24日付け手続補正書の特許請求の範囲の請求項1に記載された

「【請求項1】
複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中でエンコードする方法において、
コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得し、前記CELPベースのエンコーディングレイヤは、前記スケーラブルなスピーチおよびオーディオコーデック中に、1つまたは2つの前のレイヤを含み、前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差であることと、
離散コサイン変換(DCT)タイプの変換レイヤにおいて、前のレイヤからの前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得することと、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードすることとを含む方法。」

という発明を、

「【請求項1】
複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中で、エンコーダデバイスによってエンコードする方法において、
コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得し、前記CELPベースのエンコーディングレイヤは、前記スケーラブルなスピーチおよびオーディオコーデック中に、1つまたは2つの前のレイヤを含み、前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号をエンコードし、次にデコードすることによって取得される、前記元のオーディオ信号の再構成されたバージョンとの間の差であることと、
離散コサイン変換(DCT)タイプの変換レイヤにおいて、前のレイヤからの前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得することと、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードすることとを含む方法。」

という発明(以下、「本願発明」という。)に変更するものであり、また、独立請求項である本件補正前の請求項13、24、26、27、34、38ないし40についても同様に補正をするものである。

2.補正の適否
本件補正は、請求項1に記載した発明を特定するために必要な事項である「エンコードする方法」について、「エンコーダデバイスによってエンコードする方法」と記載して拒絶理由で指摘された不明りょうな記載についてその本来の意味内容を明らかにし、また、「元のオーディオ信号の再構成されたバージョン」について、「元のオーディオ信号と、前記元のオーディオ信号をエンコードし、次にデコードすることによって取得される、前記元のオーディオ信号の再構成されたバージョン」と記載して拒絶理由で指摘された不明りょうな記載についてその本来の意味内容を明らかにするものであるから、特許法第17条の2第5項第4号の明りょうでない記載の釈明を目的とするものに該当する。
また、特許法第17条の2第3項、第4項に違反するところはない。

第3 原査定の理由の概要
(1) 特許法第29条第2項について、
本願発明は、その出願前に日本国内又は外国において、頒布された下記の刊行物に記載された発明又は電気通信回線を通じて公衆に利用可能となった発明に基いて、その出願前にその発明の属する技術の分野における通常の知識を有する者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができない。

刊行物1:国際公開第2007/105586号
刊行物2:Udar Mittal, James P. Ashley, Edgardo M. Cruz-Zeno,Low Complexity Factorial Pulse Coding of MDCT Coefficients Using Approximation of Combinational Functions,Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. IEEE International Conference on,米国,IEEE,2007年 4月15日

(2) 特許法第36条第6項第2号について
この出願は、特許請求の範囲の記載が下記の点で、特許法第36条第6項第2号に規定する要件を満たしていない。

1.請求項 1?40
・備考
請求項1では、「元のオーディオ信号の再構成されたバージョン」と記載している。
しかしながら、「元のオーディオ信号の再構成されたバージョン」が何を意味しているのか明らかでなく、符号化されたオーディオ信号を復号化したオーディオ信号の様なものであるのか不明である。
よって、当該請求項に係る発明は明確なものでない。

2.請求項 1?12,27?33
・備考
請求項1では、「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中でエンコードする方法において…残差信号を取得し…変換スペクトルを取得することと…変換スペクトルのスペクトル線をエンコードすることとを含む方法。」と記載している。
しかしながら、当該請求項の記載のみでは、かかる「エンコードする方法」が、「人」によって行われる方法であるのか、「システム」によって行われる方法であるのか不明である。
よって、当該請求項に係る発明は明確なものでない。

3.請求項 18
・備考
請求項18では、「…請求項16記載の方法。」と記載している。
しかしながら、請求項16に記載の発明は、「デバイス」に関するものであり、「方法」という記載は、「デバイス」の誤記と思量される。

4.請求項 26,40
・備考
請求項26では、「…動作可能な命令を含む機械読み取り可能媒体において、1つ以上のプロセッサによって実行されるとき、前記命令は、…」と記載している。
しかしながら、かかる記載が、「…動作可能な命令を含む機械読み取り可能媒体において、1つ以上のプロセッサに次の動作を実行させる命令であり、前記命令は…」といった様なことを意味しているのか、それ以外を意味しているのか明らかでない。
よって、当該請求項に係る発明は明確なものでない。

5.請求項 27?33
・備考
請求項27では、「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中でデコードする方法」と記載している。
しかしながら、「コーデック中でデコードする」とは、如何なる動作を表しているのか理解できない。
よって、当該請求項に係る発明は明確なものでない。

第4 当審の判断
(1) 特許法第29条第2項について
1.刊行物の記載事項
A 原査定の拒絶の理由に引用された国際公開第2007/105586号(以下、「刊行物1」という。)には、図面とともに以下の事項が記載されている。

イ.「技術分野
[0001] 本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置および符号化方法に関する。」(1頁3?5行)

ロ.「[0030] 次に、図2の基本レイヤ復号化部203の内部構成について図5を用いて説明する。多重化分離部501は、入力した基本レイヤ情報源符号を個々の符号(L、A、G、F)に分離する。LPC符号(L)はLPC復号化部502に出力され、適応音源ベクトル符号(A)は適応音源符号帳505に出力され、音源利得符号(G)は量子化利得生成部506に出力され、固定音源ベクトル符号(F)は固定音源符号帳507に出力される。
[0031] 適応音源符号帳505は、多重化分離部501から出力された符号(A)で指定される過去の駆動音源から1フレーム分のサンプルを適応音源ベクトルとして取り出して乗算部508に出力する。量子化利得生成部506は、多重化分離部501から出力された音源利得符号(G)で指定される量子化適応音源利得と量子化固定音源利得を復号化し乗算部508及び乗算部509に出力する。固定音源符号帳507は、多重化分離部501から出力された符号(F)で指定される固定音源ベクトルを生成し、乗算部509に出力する。
[0032] 乗算部508は、適応音源ベクトルに量子化適応音源利得を乗算して、加算部510に出力する。乗算部509は、固定音源ベクトルに量子化固定音源利得を乗算して、加算部510に出力する。加算部510は、乗算部508、509から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルとの加算を行い駆動音源を生成し、これを合成フィルタ503及び適応音源符号帳505に出力する。
[0033] LPC復号化部502は、多重化分離部501から出力された符号(L)から量子化LPCを復号化し、合成フィルタ503に出力する。合成フィルタ503は、LPC復号化部502によって復号化されたフィルタ係数を用いて、加算部510から出力された駆動音源のフィルタ合成を行い、合成した信号を後処理部504に出力する。後処理部504は、合成フィルタ503から出力された信号に対して、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施し、基本レイヤ復号化信号として出力する。」(8頁20行?9頁15行)

ハ.「[0063] (実施の形態2)
上記実施の形態1では、下位レイヤ、上位レイヤ共にCELPタイプの符号化方法を用いるスケーラブル符号化方式について説明したが、本発明はこれに限らず、上位レイヤにおいてCELPタイプ以外の符号化方法を用いるスケーラブル符号化方式においても同様に適用できる。実施の形態2では、下位レイヤにてCELPタイプの符号化を行い、上位レイヤでは変換符号化を行う場合のスケーラブル符号化方式に本発明を適用する場合について説明する。本実施の形態に係る符号化装置および復号化装置を有する通信システムは、図1と同一であるので説明を省略する。
[0064] 図10は、本実施の形態に係る符号化装置101の構成を示すブロック図である。符号化装置101は、図10に示すように符号化動作制御部1001と、基本レイヤ符号化部1002と、拡張レイヤ制御部1003と、基本レイヤ復号化部1004と、第1周波数領域変換部1005と、遅延部1006と、第2周波数領域変換部1007と、拡張レイヤ符号化部1008と、多重化部1009と、から主に構成される。
[0065] 符号化動作制御部1001には、伝送モード情報が入力される。符号化動作制御部1001は、入力した伝送モード情報に応じて、制御スイッチ1010?1012のオン/オフ制御を行う。具体的には、符号化動作制御部1001は、伝送モード情報がBR2である場合、制御スイッチ1010?1012を全てオンにする。また、符号化動作制御部1001は、伝送モード情報がBR1である場合、制御スイッチ1010?1012を全てオフにする。なお、伝送モード情報は、上記のように符号化動作制御部1001に入力されるとともに、図10のように符号化動作制御部1001経由か、あるいは符号化動作制御部1001を経由せずに直接、多重化部1009にも入力される。このように、符号化動作制御部1001が伝送モード情報に応じて制御スイッチ群をオン/オフ制御することにより、入力信号の符号化に用いる符号化部の組み合わせが決定される。
[0066] 基本レイヤ符号化部1002は、音声信号等の入力信号に対してCELPタイプの音声符号化方法を用いて符号化を行って基本レイヤ情報源符号を生成し、生成した基本レイヤ符号化情報を多重化部1009および制御スイッチ1012に出力する。また、基本レイヤ符号化部1002は、入力信号の音声符号化の際に算出されるパラメータであるLPC(線形予測係数)および量子化LPCを制御スイッチ1011に出力する。なお、基本レイヤ符号化部1002の内部構成は、図4に示した基本レイヤ符号化部202のものと同一であるので、その説明は省略する。
[0067] 拡張レイヤ制御部1003は、制御スイッチ1011がオンのとき、基本レイヤ符号化部1002から出力されたLPCおよび量子化LPCに基づいて拡張レイヤモード情報を生成し、拡張レイヤモード情報を拡張レイヤ符号化部1008および多重化部1009に出力する。拡張レイヤモード情報とは、拡張レイヤにおける符号化モードを示す情報であり、復号化装置において拡張レイヤ符号化情報を復号化する際に利用される。なお、拡張レイヤ制御部1003の内部構成の詳細については後述する。また、拡張レイヤ制御部1003は、制御スイッチ1011がオフの時には何も動作しない。
[0068] 基本レイヤ復号化部1004は、制御スイッチ1012がオンのとき、基本レイヤ符号化部1002から出力された基本レイヤ符号化情報に対してCELPタイプの音声復号化方法を用いて復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号を第1周波数領域変換部1005に出力する。一方、基本レイヤ復号化部1004は、制御スイッチ1012がオフのときには何も動作しない。なお、基本レイヤ復号化部1004の内部構成は、図5の基本レイヤ復号化部203のものと同一であるので、その説明は省略する。
[0069] 第1周波数領域変換部1005は、基本レイヤ復号化部1004から入力される基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行い、周波数領域のパラメータとして得られる基本レイヤ復号化MDCT係数を拡張レイヤ符号化部1008に出力する。
[0070] 第1周波数領域変換部1005は、N個のバッファを内蔵し、まず、下記の式(4)に従い、「0」値を用いて各バッファを初期化する。なお、式(4)において、buf_(n)(n=0、…、N-1)は第1周波数領域変換部1005が内蔵しているN個のバッファの中のn+1番目を示す。
[数4]
式(4)(略)
[0071] 次いで、第1周波数領域変換部1005は、下記の式(5)に従い、基本レイヤ復号化信号x1_(n )を修正離散コサイン変換して基本レイヤ復号化MDCT係数X1_(k) を求める。式(5)において、kは1フレームにおける各サンプルのインデックスを示す。なお、x1’_(n)は、下記の式(6)に従い、基本レイヤ復号化信号x1_(n) とバッファbuf_(n )とを結合させたベクトルである。
[数5]
式(5)(略)
[数6]
式(6)(略)
[0072] 次いで、第1周波数領域変換部1005は、下記の式(7)に示すようにバッファbuf_(n)(n=0、…、N-1)を更新する。
[数7]
式(7)(略)
[0073] 次いで、第1周波数領域変換部1005は、求められた基本レイヤ復号化MDCT係数X1_(k)を拡張レイヤ符号化部1008に出力する。
[0074] 遅延部1006は、制御スイッチ1010がオンのとき、入力される音声・オーディオ信号を内蔵のバッファに記憶し、所定時間経過後に音声・オーディオ信号を第2周波数領域変換部1007に出力する。ここで、所定時間は、基本レイヤ符号化部1002、基本レイヤ復号化部1004、第1周波数領域変換部1005、および第2周波数領域変換部1007において生じるアルゴリズム遅延を考慮した時間である。また、遅延部1006は、制御スイッチ1010がオフの時には何も動作しない。
[0075] 第2周波数領域変換部1007は、制御スイッチ1010がオンのとき、遅延部1006から入力される音声・オーディオ信号に対してMDCTを行い、周波数領域のパラメータとして得られる入力MDCT係数を拡張レイヤ符号化部1008に出力する。ここで、第2周波数領域変換部1007における周波数変換方法は、第1周波数領域変換部1005における処理と同様であるため説明を省略する。また、第2周波数領域変換部1007は、制御スイッチ1010がオフの時には何も動作しない。
[0076] 拡張レイヤ符号化部1008は、制御スイッチ1010、1011、1012がオンのとき、拡張レイヤ制御部1003から入力される拡張レイヤモード情報と、第1周波数領域変換部1005から入力される基本レイヤ復号化MDCT係数および第2周波数領域変換部1007から入力される入力MDCT係数とを用いて拡張レイヤ符号化を行い、得られる拡張レイヤ符号化情報を多重化部1009に出力する。拡張レイヤ符号化部1008の内部の構成および具体的な動作については後述する。また、拡張レイヤ符号化部1008は、制御スイッチ1010、1011、1012がオフの時には何も動作しない。
[0077] 多重化部1009は、基本レイヤ符号化部1002から入力される基本レイヤ符号化情報、拡張レイヤ制御部1003から入力される拡張レイヤモード情報、拡張レイヤ符号化部1008から入力される拡張レイヤ符号化情報、及び符号化動作制御部1001から入力される伝送モード情報を多重化し、得られるビットストリームを復号化装置に送信する。」(17頁6行?20頁19行)

ニ.「[0082] 次に、図10の拡張レイヤ符号化部1008の内部構成について図12を用いて説明する。拡張レイヤ符号化部1008は、残差MDCT係数算出部1201と、帯域選択部1202と、シェイプ量子化部1203と、ゲイン量子化部1204と、多重化部1205と、から主に構成される。
[0083] 残差MDCT係数算出部1201は、第1周波数領域変換部1005から入力される基本レイヤ復号化MDCT係数X1_(k)と第2周波数領域変換部1007から入力される入力MDCT係数X_(k)との残差を求め、残差MDCT係数X2_(k)として帯域選択部1202に出力する。
[0084] 帯域選択部1202は、まず、残差MDCT係数を複数のサブバンドに分割する。ここでは、J(Jは自然数)個のサブバンドに均等に分割する場合を例に説明する。帯域選択部1202は、J個のサブバンドの中で連続するL(Lは自然数)個のサブバンドを選択し、M(Mは自然数)種類のサブバンドのグループを得る。以下、このM種類のサブバンドのグループをリージョンと呼ぶ。
[0085] 次いで、帯域選択部1202は、下記の式(8)に従い、M種類の各リージョンの平均エネルギE(m)を算出する。
[数8]
式(8)(略)
[0086] この式において、jはJ個の各サブバンドのインデックスを示し、mは、M種類の各リージョンのインデックスを示す。なお、S(m)は、リージョンmを構成するL個のサブバンドのインデックスのうちの最小値を示し、B(j)は、サブバンドjを構成する複数のMDCT係数のインデックスのうちの最小値を示す。W(j)は、サブバンドjのバンド幅を示し、以下の説明では、J個の各サブバンドのバンド幅が全て等しい場合、すなわちW(j)が定数である場合を例にとって説明する。
[0087] 次いで、帯域選択部1202は、平均エネルギE(m)が最大となるリージョン、例えばサブバンドj”?j”+L-1からなる帯域を量子化対象となる帯域(量子化対象帯域)として選択し、このリージョンを示すインデックスm_maxを帯域情報としてシェイプ量子化部1203、ゲイン量子化部1204、および多重化部1205に出力する。また、帯域選択部1202は、残差MDCT係数をシェイプ量子化部1203に出力する。なお、残差MDCT係数は、上記のように帯域選択部1202に入力されるとともに、図12のように、帯域選択部1202経由か、あるいは帯域選択部1202を経由せずに直接、シェイプ量子化部1203にも入力される。
[0088] シェイプ量子化部1203は、帯域選択部1202から入力される帯域情報m_maxが示す帯域に対応する残差MCDT係数に対して、拡張レイヤ制御部1003から入力される拡張レイヤモード情報を利用して、サブバンド毎にシェイプ量子化を行う。具体的には、シェイプ量子化部1203は、拡張レイヤモード情報がModeAの場合には、L個の各サブバンド毎に、SQA個のシェイプコードベクトルからなる内蔵のシェイプコードブックを探索して下記の式(9)の結果が最大となるシェイプコードベクトルのインデックスを求める。
[数9]
式(9)(略)
[0089] この式(9)において、SCはシェイプコードブックを構成するシェイプコードベクトルkを示し、iはシェイプコードベクトルのインデックスを示し、kはシェイプコードベクトルの要素のインデックスを示す。
[0090] また、シェイプ量子化部1203は、拡張レイヤモード情報がModeBの場合には、L個の各サブバンド毎に、SQB(SQB<SQA)個のシェイプコードベクトルからなる内蔵のシェイプコードブックを探索して下記の式(10)の結果が最大となるシェイプコードベクトルのインデックスを求める。
[数10]
式(10)(略)
[0091] シェイプ量子化部1203は、上記の式(9)あるいは式(10)の結果が最大となるシェイプコードベクトルのインデックスS_maxをシェイプ符号化情報として多重化部1205に出力する。また、シェイプ量子化部1203は、下記の式(11)に従い、理想ゲイン値Gain_i(j)を算出してゲイン量子化部1204に出力する。
[数11]
式(11)(略)
[0092] ゲイン量子化部1204は、シェイプ量子化部1203から入力される理想ゲイン値Gain_i(j)に対して、拡張レイヤ制御部1003から入力される拡張レイヤモード情報を利用して、ゲイン値のベクトル量子化を行う。具体的には、ゲイン量子化部1204は、拡張レイヤモード情報がModeAの場合には、理想ゲイン値をL次元ベクトルとして扱い、GQA個のゲインコードベクトルからなる内蔵のゲインコードブックを探索して下記の式(12)を最小にするコードブックのインデックスを求める。なお、上記の式(12)を最小にするコードブックのインデックスをG_minと記す。
[数12]
式(12)(略)
[0093] また、ゲイン量子化部1204は、拡張レイヤモード情報がModeBの場合には、理想ゲイン値をL次元ベクトルとして扱い、GQB(CQB<CQA)個のゲインコードベクトルからなる内蔵のゲインコードブックを探索して下記の式(13)を最小にするコードブックのインデックスを求める。
[数13]
式(13)(略)
[0094] ゲイン量子化部1204は、式(12)あるいは式(13)の結果が最小となるゲインコードベクトルのインデックスG_minをゲイン符号化情報として多重化部1205に出力する。
[0095] 多重化部1205は、帯域選択部1202から入力される帯域情報m_max、シェイプ量子化部1203から入力されるシェイプ符号化情報S_max、ゲイン量子化部1204から入力されるゲイン符号化情報G_minを多重化し、得られるビットストリームを拡張レイヤ符号化情報として多重化部1009に出力する。なお、これら情報を、多重化部1205で多重化せず、多重化部1009に直接入力して、多重化部1009で多重化してもよい。」(21頁11行?24頁16行)

上記刊行物1の記載及び図面並びにこの分野における技術常識を考慮すると、上記ハ.の[0063]における「本発明はこれに限らず、上位レイヤにおいてCELPタイプ以外の符号化方法を用いるスケーラブル符号化方式においても同様に適用できる。実施の形態2では、下位レイヤにてCELPタイプの符号化を行い、上位レイヤでは変換符号化を行う場合のスケーラブル符号化方式に本発明を適用する場合について説明する。」との記載、同ハ.の[0064]における「図10は、本実施の形態に係る符号化装置101の構成を示すブロック図である。符号化装置101は、図10に示すように符号化動作制御部1001と、基本レイヤ符号化部1002と、拡張レイヤ制御部1003と、基本レイヤ復号化部1004と、第1周波数領域変換部1005と、遅延部1006と、第2周波数領域変換部1007と、拡張レイヤ符号化部1008と、多重化部1009と、から主に構成される。」との記載、及び図10によれば、スケーラブル符号化方式は、基本レイヤ及び拡張レイヤを有するスケーラブルな符号化方式で、符号化装置(101)によって符号化する方法ということができる。ここで、同ハ.の[0066]における「基本レイヤ符号化部1002は、音声信号等の入力信号に対してCELPタイプの音声符号化方法を用いて符号化を行って基本レイヤ情報源符号を生成し」との記載によれば、スケーラブル符号化方式は、音声信号等を入力信号としている。
また、上記ハ.の[0068]における「基本レイヤ復号化部1004は、制御スイッチ1012がオンのとき、基本レイヤ符号化部1002から出力された基本レイヤ符号化情報に対してCELPタイプの音声復号化方法を用いて復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号を第1周波数領域変換部1005に出力する。」との記載、同ハ.の[0069]における「第1周波数領域変換部1005は、基本レイヤ復号化部1004から入力される基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行い、周波数領域のパラメータとして得られる基本レイヤ復号化MDCT係数を拡張レイヤ符号化部1008に出力する。」との記載、及び図10によれば、スケーラブル符号化方式は、基本レイヤ符号化部(1002)から出力された基本レイヤ符号化情報に対して復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行って周波数領域の基本レイヤ復号化MDCT係数を拡張レイヤ符号化部(1008)に出力している。そして、上記ニ.の[0083]における(拡張レイヤ符号化部(1008)の)「残差MDCT係数算出部1201は、第1周波数領域変換部1005から入力される基本レイヤ復号化MDCT係数X1_(k)と第2周波数領域変換部1007から入力される入力MDCT係数X_(k)との残差を求め、残差MDCT係数X2_(k)として帯域選択部1202に出力する。」との記載、図10及び図12によれば、スケーラブル符号化方式は、拡張レイヤ符号化部(1008)の残差MDCT係数算出部(1201)において、基本レイヤ復号化MDCT係数(X1_(k))と入力MDCT係数(X_(k))との残差を求めている。すなわち、基本レイヤ符号化情報に対して復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行って周波数領域とした基本レイヤ復号化MDCT係数(X1_(k))と入力MDCT係数(X_(k))から残差を求めている。ここで、上記ハ.の[0068]における「基本レイヤ復号化部1004の内部構成は、図5の基本レイヤ復号化部203のものと同一である」との記載、上記ロ.の[0031]における「適応音源符号帳505は、多重化分離部501から出力された符号(A)で指定される過去の駆動音源から1フレーム分のサンプルを適応音源ベクトルとして取り出して乗算部508に出力する。」との記載、及び図5によれば、基本レイヤ復号化部(203,1004)の適応音源符号帳(505)は、過去の駆動音源の適応音源ベクトルを基本レイヤ復号化信号に含んでいる。
また、上記ニの[0082]における「図10の拡張レイヤ符号化部1008の内部構成について図12を用いて説明する。拡張レイヤ符号化部1008は、残差MDCT係数算出部1201と、帯域選択部1202と、シェイプ量子化部1203と、ゲイン量子化部1204と、多重化部1205と、から主に構成される。」との記載、同ニ.の[0095]における「多重化部1205は、帯域選択部1202から入力される帯域情報m_max、シェイプ量子化部1203から入力されるシェイプ符号化情報S_max、ゲイン量子化部1204から入力されるゲイン符号化情報G_minを多重化し、得られるビットストリームを拡張レイヤ符号化情報として多重化部1009に出力する。」との記載、及び図12によれば、スケーラブル符号化方式は、拡張レイヤ符号化部(1008)の残差MDCT係数算出部(1201)、帯域選択部(1202)、シェイプ量子化部(1203)及びゲイン量子化部(1204)により、前述の残差から拡張レイヤ符号化情報を出力している。

したがって、上記刊行物1には、以下の発明(以下、「引用発明」という。)が記載されているものと認められる。

「基本レイヤ及び拡張レイヤを有するスケーラブルな音声信号等符号化方式で、符号化装置(101)によって符号化する方法において、
基本レイヤ符号化情報に対して復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行って周波数領域とした基本レイヤ復号化MDCT係数(X1_(k))と入力MDCT係数(X_(k))から残差を求め、前記基本レイヤ復号化信号に、過去の駆動音源の適応音源ベクトルを含み、
前記残差から拡張レイヤ符号化情報を出力することを含む方法。」

B 原査定の拒絶の理由に引用されたUdar Mittal, James P. Ashley, Edgardo M. Cruz-Zeno,Low Complexity Factorial Pulse Coding of MDCT Coefficients Using Approximation of Combinational Functions,Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. IEEE International Conference on,米国,IEEE,2007年 4月15日(以下、「刊行物2」という。)には、図面とともに以下の事項が記載されている。

ホ.「ABSTRACT

Factorial pulse coding, a method which is known to efficiently code an information signal using unit magnitude pulses, involves computation of combinatorial functions. These computations are highly complex as they require many multiply and divide operations on multi-precision numbers, especially when the length of a signal is large or many unit magnitude pulses are used for coding. In this paper, we propose a very low complexity method for approximation of these combinatorial functions. The approximate functions satisfy a property which preserves unique decode-ability of the factorial packing encoding/decoding algorithm. The low complexity computation enables use of factorial packing in encoding/decoding of 144 MDCT coefficients using 28 unit magnitude pulses for the audio coding mode of the EVRCWB speech coding standard without affecting the number of bits required for coding.
Index Terms-factorial packing, factorial pulse coding, enumeration, MDCT, audio coding

1. INTRODUCTION

Factorial pulse coding (FPC) [1] is an enumerative method for coding a vector x ={X_(0), x_(1), ..,x_(n-1)} satisfying
式(1)(略)
and all values of vector x_(i) are integral valued such that -m ≦ x_(i) ≦ m, where m is the total number of unit amplitude pulses, and n is the vector length. The M = [log_(2) (N)] bits are used to code N combinations in a maximally efficient manner [1,2], such that the following expression, which describes the theoretical minimum number of combinations, holds true:
式(2)(略)
For this equation, F(n, d) is given by:
式(3)(略)
D(m,d) are the number of combinations of d non-zero vector elements given m total unit pulses given by:
式(4)(略)
and 2^(d) represents the combinations required to describe the polarity (sign) of the d non-zero vector elements. In the FPC method, the information content is divided into four constituents: 1) number of non-zero pulse positions (ν); 2) position ofthe non-zero pulses (π; 3) magnitude ofthe nonzero pulses (μ); and 4) signs ofthe non-zero pulses (σ). The encoding of pulse positions in FPC is given by
式(5)(略)
where π={p_(1), p_(2),…, p_(n)}.」(I-289頁左欄1行?同頁右欄13行)

訳文(ホ.)「要約

階乗パルスコーディングは、単位パルスを使用した有効な情報信号コードとして知られている方法であり、組み合わせ関数の計算を行うためものである。これらの計算は、それが多くの掛け算を行い、また多倍精度数に基づいて操作を分けなければならないために、非常に複雑になる。特にコーディングのための信号長が大きく、または単位パルスの多数倍の大きさを持ったパルスが使用されているときには、操作が非常に複雑になる。本論文では、これらの組み合わせ関数を近似するために、複雑さの度合いの低い方法を提案する。この近似関数は、階乗圧縮エンコーディング/デコーディングアルゴリズムの持つユニークなデコード能力を保持している。この複雑さの度合いの低い計算により、EVRC-WBスピードコーディング標準のオーディオコーディングモードのために、単位パルスの28倍の大きさのパルスを使用し、コーディングに必要なビット数に影響を与えないで、144MDCT係数の階乗圧縮エンコーディング/デコーディングの使用を可能にする。
索引用語‐階乗圧縮,階乗パルスコーディング,計数,MDCT,オーディオコーディング

1. はじめに

階乗パルスコーディング(FPC)[1]は、ベクトルx={x_(0), x_(1),…, x_(n-1)}をコーディングするための計数方法である。個々で、xは以下の式を満たす。
式(1)(略)
そして、ベクトルx_(i)のすべての値を、-m≦x_(i)≦mのような整数値として見積もる。ここで、mは単位振幅パルスの全加算数であり、nはベクトル数である。最も効果のある方法で[1,2]、N個の組み合わせをコーディングするために、組み合わせが理論的に最少となる数を表す次のような式でM=[log_(2)(N)]ビットを使用する。それは以下の式に当てはまる。
式(2)(略)
この式で、F(n, d)は次のような式で与えられる。
式(3)(略)
ここで、D(m, d)は、次式のように全単位パルス(全加算数)mで与えられるゼロでないベクトル成分dの組み合わせ数である。
式(4)(略)
また2^(d)はゼロでないベクトル成分の極性(±の符号)を表すために必要な組み合わせを表す。FPC法では、情報コンテンツは4つの構成に分かれる。それらは、1)非ゼロパルス位置の数(ν)、2)非ゼロパルスの位置(π)、3)非ゼロパルスの大きさ(μ)、および4)非ゼロパルスの符号(σ)である。FPCにおけるパルス位置のエンコーディングは、次のように与えられる。
式(5)(略)
ここで、π={p_(1),p_(2),…p_(n)}である。」」

上記刊行物2の記載及び図面並びにこの分野における技術常識を考慮すると、上記ホ.における「階乗パルスコーディングは、単位パルスを使用した有効な情報信号コードとして知られている方法であり、組み合わせ関数の計算を行うためものである。」との記載、「FPCにおけるパルス位置のエンコーディングは、次のように与えられる。式(5)(略)」との記載によれば、階乗パルスコーディングは、組み合わせ関数を用いパルス位置をエンコーディングしている。

したがって、上記刊行物2には、以下の発明(以下、「技術事項」という。)が記載されているものと認められる。

「組み合わせ関数を用いパルス位置をエンコーディングする階乗パルスコーディング。」

2.対比
本願発明と引用発明とを対比する。
a.引用発明の「基本レイヤ及び拡張レイヤ」は、「複数のレイヤ」に含まれる。
b.引用発明の「音声信号等符号化方式」は、上記刊行物1の上記ハ.の[0075]における「第2周波数領域変換部1007は、制御スイッチ1010がオンのとき、遅延部1006から入力される音声・オーディオ信号に対してMDCTを行い」との記載によれば、音声信号等は、音声・オーディオ信号であるから、「スピーチ」(speech)音声およびオーディオといえ、符号化方式は、コーデックに含まれるから、「スピーチおよびオーディオコーデック中」ということができる。
c.引用発明の「符号化装置(101)」は、本願発明の「エンコーダデバイス」に相当する。
d.引用発明の「基本レイヤ符号化情報」は、上記刊行物1の上記ハ.の[0066]における「基本レイヤ符号化部1002は、音声信号等の入力信号に対してCELPタイプの音声符号化方法を用いて符号化を行って基本レイヤ情報源符号を生成し」との記載によれば、コード励振線形予測(CELP)に基づいているから、「コード励振線形予測(CELP)ベース」の「エンコーディングレイヤ」ということができる。
e.引用発明の「基本レイヤ符号化情報に対して復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行って周波数領域とした基本レイヤ復号化MDCT係数(X1_(k))と入力MDCT係数(X_(k))から残差を求め」と、本願発明の「コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得し」とは、上記d.の対比を考慮すると、いずれも、「コード励振線形予測(CELP)ベースのエンコーディングレイヤについて残差信号を取得し」という点で一致する。
f.引用発明の「前記基本レイヤ復号化信号に、過去の駆動音源の適応音源ベクトルを含み」は、「前記基本レイヤ復号信号」は、「前記CELPベースのエンコーディングレイヤ」で使用される(コーデック中)の復号化信号に含まれ、「過去の駆動音源の適応音源ベクトル」は、過去の駆動音源、すなわち、過去の基本レイヤ(前のレイヤ)の要素であるから、「前記CELPベースのエンコーディングレイヤは、前記スケーラブルなスピーチおよびオーディオコーデック中に、1つまたは2つの前のレイヤを含み」ということができる。
g.引用発明の「前記残差から拡張レイヤ符号化情報を出力すること」と、本願発明の「離散コサイン変換(DCT)タイプの変換レイヤにおいて、前のレイヤからの前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得すること」とは、上記刊行物1の上記ニ.の[0083]における「残差MDCT係数算出部1201は、第1周波数領域変換部1005から入力される基本レイヤ復号化MDCT係数X1_(k)と第2周波数領域変換部1007から入力される入力MDCT係数X_(k)との残差を求め」との記載によれば、「前記残差」は、周波数変換部(修正離散コサイン変換(MDCT))処理の後、「拡張レイヤ符号化情報」として出力されるものであり、当該「拡張レイヤ符号化情報」は、離散コサイン変換(DCT)タイプの変換レイヤに含まれるから、いずれも、「離散コサイン変換(DCT)タイプの変換レイヤにおいて、特定の情報を取得すること」という点で一致する。

したがって、本願発明と引用発明は、以下の点で一致ないし相違している。

(一致点)
「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中で、エンコーダデバイスによってエンコードする方法において、
コード励振線形予測(CELP)ベースのエンコーディングレイヤについて残差信号を取得し、前記CELPベースのエンコーディングレイヤは、前記スケーラブルなスピーチおよびオーディオコーデック中に、1つまたは2つの前のレイヤを含み、
離散コサイン変換(DCT)タイプの変換レイヤにおいて、特定の情報を取得することを含む方法。」

(相違点1)
「コード励振線形予測(CELP)ベースのエンコーディングレイヤについて残差信号を取得し」に関し、
本願発明は、「コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得す」るのに対し、引用発明は、「基本レイヤ符号化情報に対して復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行って周波数領域とした基本レイヤ復号化MDCT係数(X1_(k))と入力MDCT係数(X_(k))から残差を求め」る点。

(相違点2)
「残差信号」に関し、
本願発明は、「前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号をエンコードし、次にデコードすることによって取得される、前記元のオーディオ信号の再構成されたバージョンとの間の差であること」であるのに対し、引用発明は、その様な構成を備えない点。

(相違点3)
「離散コサイン変換(DCT)タイプの変換レイヤにおいて、特定の情報を取得すること」に関し、
本願発明は、「離散コサイン変換(DCT)タイプの変換レイヤにおいて、前のレイヤからの前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得すること」であるのに対し、引用発明は、「前記残差から拡張レイヤ符号化情報を出力すること」である点。

(相違点4)
本願発明は、「組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードすること」を含むのに対し、引用発明は、その様な構成を含まない点。

3.判断
上記相違点1について検討する。
引用発明は、そもそも、「基本レイヤ符号化情報に対して復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号に対して修正離散コサイン変換(MDCT)を行って周波数領域とした基本レイヤ復号化MDCT係数(X1_(k))と入力MDCT係数(X_(k))から残差を求め」ており、基本レイヤ符号化情報(コード励振線形予測(CELP)ベースのエンコーディングレイヤ)から直接時間領域で残差信号を取得していない。すなわち、引用発明は、基本レイヤ符号化情報(コード励振線形予測(CELP)ベースのエンコーディングレイヤ)から修正離散コサイン変換(MDCT)を行って周波数領域において残差を求めており、本願発明のように残差信号(残差)を求める次元が時間領域のものとは基本原理が異なるものであって、求められた残差(残差信号)の値も周波数領域の値と時間領域の値とでは実質的に異なることは明らかである。
そうすると、引用発明から、上記相違点1ないし4における本願発明の発明特定事項である「コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得す」る点、「前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号をエンコードし、次にデコードすることによって取得される、前記元のオーディオ信号の再構成されたバージョンとの間の差であること」、「離散コサイン変換(DCT)タイプの変換レイヤにおいて、前のレイヤからの前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得すること」及び「組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードすること」を導き出すことはできない。
また、上記技術事項には、「組み合わせ関数を用いパルス位置をエンコーディングする階乗パルスコーディング。」が開示されているところ、そもそも、複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中で、エンコーダデバイスによってエンコードする方法でないから、引用発明に上記技術事項を採用する動機づけを見いだすことができない。

そして、本願発明は、上記各発明特定事項を備えることによって、スケーラブルなスピーチおよびオーディオ圧縮アルゴリズムにおける、DCTスペクトルのエンコーディング/デコーディングのための効率的な技術を提供することができるという作用効果を奏するものである。

したがって、本願発明は、引用発明及び技術事項に基いて、当業者が容易に発明をすることができたとはいえない。また、補正後の請求項13、24、26、27、34、38ないし40に係る発明についても同様である。

(2) 特許法第36条第6項第2号について
平成25年4月11日に拒絶査定不服の審判が請求されるとともに、同日付けで手続補正が以下のようになされた。

理由(2) 1.について
平成25年4月11日付け手続補正書において、補正前の請求項1に規定の「前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差であること」を「前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号をエンコードし、次にデコードすることによって取得される、前記元のオーディオ信号の再構成されたバージョンとの間の差であること」に補正した(他の請求項13、24?27、34、38?40についても同様)。

理由(2) 2.について
平成25年4月11日付け手続補正書において、補正前の請求項1に記載の「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中でエンコードする方法」を「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中で、エンコーダデバイスによってエンコードする方法」に補正した。同様に、補正前の請求項27に記載の「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中でデコードする方法」を「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中で、デコーダデバイスによってデコードする方法」に補正した。

理由(2) 3.について
平成25年4月11日付け手続補正書において、補正前の請求項18に記載の「請求項16記載の方法」を「請求項16記載のデバイス」に補正した。

理由(2) 4.について
平成25年4月11日付け手続補正書において、機械読み取り可能媒体に含まれている命令が、1つ以上のプロセッサにより実行されるときに、プロセッサに各動作を実行させることが明確になるように、請求項26、40を補正した。

理由(2) 5.について
平成25年4月11日付け手続補正書において、補正前の請求項27に記載の「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中でデコードする方法」を「複数のレイヤを有するスケーラブルなスピーチおよびオーディオコーデック中で、デコーダデバイスによってデコードする方法」に補正した。

したがって、請求項1ないし40に係る発明は明確なものである。

第5 むすび
以上のとおり、本願発明は、刊行物1及び2に記載された発明に基いて、当業者が容易に発明をすることができたものとすることができない。また、請求項1ないし40に係る発明は明確なものである。したがって、原査定の理由によっては、本願を拒絶することはできない。
また、他に本願を拒絶すべき理由を発見しない。
よって、結論のとおり審決する。
 
審決日 2014-02-26 
出願番号 特願2010-531210(P2010-531210)
審決分類 P 1 8・ 121- WY (G10L)
P 1 8・ 574- WY (G10L)
最終処分 成立  
前審関与審査官 安田 勇太  
特許庁審判長 石井 研一
特許庁審判官 関谷 隆一
萩原 義則
発明の名称 MDCTスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング  
代理人 蔵田 昌俊  
代理人 幸長 保次郎  
代理人 竹内 将訓  
代理人 河野 直樹  
代理人 砂川 克  
代理人 岡田 貴志  
代理人 白根 俊郎  
代理人 中村 誠  
代理人 堀内 美保子  
代理人 井上 正  
代理人 赤穂 隆雄  
代理人 峰 隆司  
代理人 福原 淑弘  
代理人 佐藤 立志  
代理人 野河 信久  
代理人 井関 守三  
  • この表をプリントする

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ