• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない(前置又は当審拒絶理由) G10L
管理番号 1303726
審判番号 不服2014-2583  
総通号数 189 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2015-09-25 
種別 拒絶査定不服の審決 
審判請求日 2014-02-10 
確定日 2015-07-29 
事件の表示 特願2011-517359「音声/音楽統合信号の符号化/復号化装置」拒絶査定不服審判事件〔平成22年 1月21日国際公開、WO2010/008176、平成23年10月20日国内公表、特表2011-527032〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 1.手続の経緯

本願は、平成21年7月14日(パリ条約による優先権主張 2008年7月14日 韓国)を国際出願日とする出願であって、平成24年8月1日付け拒絶理由通知に対して同年11月5日付けで意見書の提出とともに手続補正がされ、平成25年3月19日付け拒絶理由通知に対して、同年7月23日付けで意見書の提出とともに手続補正がされたが、平成25年10月3日付けで補正の却下の決定がされるとともに、同日付で拒絶査定がなされた。
これに対して、平成26年2月10日付けで拒絶査定不服審判が請求されるとともに、同日付で手続補正がされたが、当審における平成26年10月17日付け拒絶理由通知に対して、平成27年1月21日付けで意見書を提出するとともに手続補正がなされたものである。


2.本願発明
本願の請求項1ないし11に係る発明は、平成27年1月21日付け手続補正書により補正された特許請求の範囲の請求項1ないし11に記載された事項により特定されるとおりのものと認められるところ、請求項1に係る発明(以下「本願発明」という。)は、次のとおりのものである。

「【請求項1】
入力信号の特性を分析する入力信号分析部と、
前記入力信号がステレオ信号である場合、モノラル信号でダウンミックスして、ステレオ音像情報を抽出するステレオ符号化部と、
前記入力信号の周波数帯域を拡張する周波数帯域拡張部と、
前記入力信号の入力ビット率および前記入力信号が音声特性を有する信号であるか音楽特性を有する信号であるかに応じて符号化方式を決定し、決定された符号化方式に基づいて前記周波数帯域拡張部の出力信号に対するサンプリング率を決定するサンプリング率変換部と、
前記入力信号が音声特性を有する信号である場合、音声符号化モジュールを用いて前記入力信号で周波数帯域が拡張されないコア帯域を符号化する音声信号符号化部と、
前記入力信号が音楽特性を有する信号である場合、音楽符号化モジュールを用いて前記入力信号で周波数帯域が拡張されないコア帯域を符号化する音楽信号符号化部と、
前記音声信号符号化部の出力信号および前記音楽信号符号化部の出力信号を用いてビットストリームを生成するビットストリーム生成部と、
を含み、
前記サンプリング率変換部は、
前記入力信号を1/2にダウンサンプリングする第1ダウンサンプリング部と、
前記第1ダウンサンプリング部の出力信号を1/2にダウンサンプリングする第2ダウンサンプリング部と、を含んでおり、
前記ビットストリーム生成部は、前記入力信号のフレームが音声特性と音楽特性との間で変化する場合、フレーム単位に応じて音声特性と音楽特性との間の変化を補償する情報をビットストリームに格納することを特徴とする音声/音楽統合信号の符号化装置。」


3.引用例の記載と引用発明の認定
(1)引用例1
当審における平成26年10月17日付け拒絶の理由に引用した国際公開第07/86646号(以下、「引用例1」という。)には、図面と共に、以下の記載がある。

ア「Technical Field
[1] The present general inventive concept relates to an audio encoding and/or decoding apparatus and method, and particularly, to an adaptive time/frequency-based audio encoding apparatus and a method of determining an encoding mode of the apparatus, in which time-based encoding or frequency-based encoding is adaptively applied according to a data property, thereby acquiring high compression efficiency with the use of a coding advantage of the time-based and frequency-based encoding modes.
Background Art
[2] Conventional voice/audio compression modes are largely classified into two types.
One type is audio codec and the other type is voice codec. The audio codec, such as aacPlus, is an algorithm to compress a signal in a frequency domain, to which a psy- choacoustic model is applied. When the audio codec is used to compress a voice signal instead of an audio signal, timbre is deteriorated much more than if the voice signal was compressed with the voice codec mode, even if a same amount of data is encoded. Particularly, there is greater timbre deterioration around a frequency of an attack signal. On the other hand, the voice codec such as AMR-WB is an algorithm to compress a signal in a time domain. When the voice codec is used to compress an audio signal instead of a voice signal, timbre is deteriorated much more than if the audio signal was compressed with audio codec mode, even if a same amount of data is encoded.」
(仮訳として、上記国際出願の対応日本出願の公表公報である特表2009-524846号の対応部分を示す。なお、下線は当審が付した。以下同様。)
(「【技術分野】
【0001】
本発明は、オーディオ符号化/復号化装置および方法に関し、より詳細には、入力オーディオデータの特性に応じて時間ベース符号化または周波数ベース符号化を適応的に選択して入力オーディオデータを符号化することで、2種類の符号化方式の符号化利得を最大限に用いて高圧縮効率を得ることができる適応的時間/周波数ベースオーディオ符号化装置および符号化モード決定方法に関する。
【背景技術】
【0002】
既存の音声/音楽圧縮方式は、オーディオコーデックと音声コーデックとに大別される。aacPlusなどのオーディオコーデックは、周波数領域上の信号を圧縮するアルゴリズムであって、心理音響モデルを適用するが、圧縮対象がオーディオ信号ではなく音声信号である場合には、同じ符号化データ量で考慮するときに、音声コーデック方式の圧縮結果物よりも音質が大きく低下し、特にアタック(attack)信号には音質低下がさらに大きい。この反面、AMR-WBなどのコーデックは、時間領域上の信号を圧縮するアルゴリズムであって、音声発声モデルを適用するが、圧縮対象が音声信号ではなくオーディオ信号の場合には、同じ符号化データ量で考慮するときに、オーディオコーデック方式の圧縮結果物よりも音質が大きく低下するという短所がある。」)

イ「 Technical Solution
[8] Additional aspects and advantages of the present general inventive concept will be set forth in part in the description which follows and, in part, will be obvious from the description, or may be learned by practice of the general inventive concept.
[9] The foregoing and/or other aspects and utilities of the present general inventive concept may be achieved by providing an adaptive time and/or frequency-based encoding mode determination apparatus including a time domain feature extraction unit to generate a time domain feature by analyzing a time domain signal of an input audio signal, a frequency domain feature extraction unit to generate a frequency domain feature corresponding to each frequency band generated by dividing a frequency domain corresponding to a frame of the input audio signal into a plurality of frequency domains, by analyzing a frequency domain signal of the input audio signal, and a mode determination unit to determine one of a time-based encoding mode and a frequency-based encoding mode with respect to the each frequency band, with use of the time domain feature and the frequency domain feature.
[10] The foregoing and/or other aspects and utilities of the present general inventive concept may also be achieved by providing an adaptive time and/or frequency-based audio encoding apparatus including, a time domain feature extraction unit to generate a time domain feature by analyzing a time domain signal of an input audio signal, a frequency domain feature extraction unit to generate a frequency domain feature corresponding to each frequency band generated by dividing a frequency domain corresponding to a frame of the input audio signal into a plurality of frequency domains, by analyzing a frequency domain signal of the input audio signal, a mode determination unit to determine one of a time-based encoding mode and a frequency- based encoding mode with respect to the each frequency band, with the use of the time domain feature and the frequency domain feature, an encoding unit to encode with the determined encoding mode with respect to the each frequency band to generate encoded data, and a bit stream output unit to process a bit stream with respect to the encoded data and to output the processed bit stream. 」
(「【課題を解決するための手段】
【0008】
上述した目的を達成し、従来技術の問題点を解決するために、本発明の適応的時間/周波数ベース符号化モード決定装置は、入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する周波数領域特性抽出部と、前記時間領域特性および前記周波数領域特性を用いて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器とを備えることを特徴とする。
【0009】
また、本発明の適応的時間/周波数ベースオーディオ符号化装置は、入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームの周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する周波数領域特性抽出部と、前記時間領域特性および前記周波数領域特性を用いて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器と、前記周波数バンドそれぞれに対して前記決定された符号化モードで符号化する符号化部と、前記符号化されたデータに対するビットストリーム処理をし、処理されたビットストリームを出力するビットストリーム出力部とを備えることを特徴とする。」)

ウ「Mode for the Invention
[28] Reference will now be made in detail to the embodiments of the present general inventive concept, examples of which are illustrated in the accompanying drawings, wherein like reference numerals refer to the like elements throughout. The em- bodiments are described below in order to explain the present general inventive concept by referring to the figures.
[29] FlG. 1 is a block diagram illustrating an adaptive time and/or frequency-based audio encoding apparatus according to an embodiment of the present general inventive concept.
[30] Referring to FlG. 1, the adaptive time/frequency-based audio encoding apparatus includes a transform/mode determination unit 110, an encoding unit 120, and a bit stream output unit 130.
[31] The transform/mode determination unit 110 frequency-transforms an input audio signal IN for each frame and determines whether a time-based encoding mode or a frequency-based encoding mode is to be utilized, with respect to each frequency band generated, by dividing a transformed frequency domain into a plurality of frequency domains. In this process, the transform/mode determination unit 110 outputs a frequency domain signal Sl determined to be the time-based encoding mode, a frequency domain signal S2 determined to be the frequency-based encoding mode, information S3 with respect to frequency domain division, and encoding mode information S4 of the each frequency band. In this case, when the frequency domain is equally divided, since the division information may not be required for decoding, the information S3 with respect to the frequency domain division may not be used.
[32] The encoding unit 120 time-based encodes the frequency domain signal Sl determined to be the time-based encoding mode, frequency-based encodes the frequency domain signal S2 determined to be the frequency-based encoding mode, and outputs time-based encoded data S5 and frequency-based encoded data S6.
[33] The bit stream output unit 130 processes a bit stream with respect to the encoded data S5 and S6 and outputs the processed bit stream OUT. In this case, the bit stream output unit 130 may process the bit stream by using the information S3 with respect to the frequency domain division and the encoding mode information S4 of the each frequency band. In this case, the bit stream may go through a data compression process such as entropy encoding. 」
(「【発明を実施するための最良の形態】
【0013】
本発明において、時間ベース符号化方式は、CELP(Code Excited Linear Prediction)など時間軸上で圧縮を行う音声圧縮アルゴリズムを意味しており、周波数ベース符号化方式は、TCX、AAC(Advanced Audio Codec)など周波数軸上で圧縮を行うオーディオ圧縮アルゴリズムを意味する。
【0014】
以下、本発明に係る好ましい実施形態を、添付の図面を参照しながら詳細に説明する。
【0015】
図1は、本発明の一実施形態に係る適応的時間/周波数ベースオーディオ符号化装置を示すブロック図である。図1を参照するに、適応的時間/周波数ベースオーディオ符号化装置は、変換/モード決定部110と、符号化部120と、ビットストリーム出力部130とを備える。
【0016】
変換/モード決定部110は、入力オーディオ信号INをフレーム単位で周波数変換(frequency transform)し、変換した周波数領域を複数の周波数領域に分割して生成された周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定する。この過程を介して、変換/モード決定部110は、時間ベース符号化モードとして決定された周波数領域信号S1、周波数ベース符号化モードとして決定された周波数領域信号S2、周波数領域分割に関する情報S3、周波数バンドそれぞれの符号化モード情報S4を出力する。このとき、周波数領域を一貫して分割する場合であれば、復号化ステップにおいて分割情報を必要としない場合もあるため、周波数領域分割に関する情報S3は用いられない場合もある。
【0017】
符号化部120は、時間ベース符号化モードとして決定された周波数領域信号S1を時間ベース符号化し、周波数ベース符号化モードとして決定された周波数領域信号S2を周波数ベース符号化し、時間ベース符号化されたデータS5および周波数ベース符号化されたデータS6を出力する。
【0018】
ビットストリーム(bit stream)出力部130は、符号化されたデータS5、S6に対するビットストリーム処理をし、処理されたビットストリームを出力する。このとき、ビットストリーム出力部130は、周波数領域分割に関する情報S3および周波数バンドそれぞれの符号化モード情報S4を用いてビットストリーム処理を行うことができる。このとき、ビットストリームは、エントロピー符号化などのデータ圧縮過程を経ることもできる。」)

エ「[43] The output unit 330 receives the frequency domain signal S7 and a mode signal S8 representing one of the frequency-based and the time-based modes and outputs the frequency domain signal determined to be the time-based encoding mode Sl, the frequency domain signal determined to be the frequency-based encoding mode S2, the information associated with a frequency domain division S3, and the encoding mode information S4 according to a determination result of the encoding mode determination unit 320. 」
(「【0027】
出力部330は、符号化モード判断部320の判断結果に応じて、周波数領域信号S7を時間ベース符号化モードとして決定された周波数領域信号S1、周波数ベース符号化モードとして決定された周波数領域信号S2、周波数領域分割に関する情報S3、および符号化モード情報S4を出力する。」)

オ「[53] The mode determination unit 430 determines an encoding mode for each frequency band to be the time-based encoding mode or the frequency-based encoding mode by using the time domain short-term feature, the frequency domain short-term feature, the time domain long-term feature, and the frequency domain long-term feature. In this case, the mode determination unit 430 may determine the encoding mode of each frequency band by using a result of the time domain signal of the previous, current, and next frames and a result of analyzing the frequency domain signal of the previous, current, and next frames.」
(【0037】
モード決定器430は、時間領域短区間特性、周波数領域短区間特性、時間領域長区間特性、および周波数領域長区間特性を用いて、周波数バンドそれぞれに対する符号化モードを時間ベース符号化モードおよび周波数ベース符号化モードのうちの1つとして決定する。このとき、モード決定器430は、以前フレーム、現在フレーム、および次フレームの時間領域信号分析結果、および以前フレームおよび現在フレームの周波数領域信号分析結果を用いて、周波数バンド別に符号化モードを決定することができる。)

カ「[70] As a determination result of operation S550, when the continuity of the periodicity of the input audio signal is continuously maintained for more than the predetermined period, the mode determination unit 430 determines the encoding mode to be the frequency-based encoding mode (operation S570).
[72] As the determination result of operation S550, when the continuity of the periodicity of the input audio signal is not continuously maintained for more than the predetermined period, the mode determination unit 430 determines whether a music continuity in which frequency spectral tilt is gentle and a high frame energy is continuously maintained for a certain period is more than a predetermined level (operation S560).
[73] As a determination result of operation S560, when the music continuity in which the frequency spectral tilt is gentle and the high frame energy is continuously maintained for the certain period is more than the predetermined level, the mode determination unit 430 determines the encoding mode to be the frequency-based encoding mode (operation S570).
[74] As the determination result of operation S560, when the music continuity in which the frequency spectral tilt is gentle and the high frame energy is continuously maintained for the certain period is not more than the predetermined level, the mode determination unit 430 determines the encoding mode to be the time-based encoding mode (operation S580).」
(「【0053】
ステップS550の判断結果、入力オーディオ信号の周期性の連続性が所定の区間以上持続する場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
【0054】
ステップS550の判断結果、入力オーディオ信号の周期性の連続性が所定の区間以上持続しない場合に、モード決定器は、周波数スペクトラムの傾斜が緩慢である上に、高いフレームエネルギーが一定の区間以上連続して持続する程度である音楽連続性(music continuity)が所定のレベル以上であるか否かを判断するS560。
【0055】
ステップS560の判断結果、周波数スペクトラムの傾斜が緩慢である上に、高いフレームエネルギーが一定の区間以上連続して持続する程度が所定のレベル以上である場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
【0056】
ステップS560の判断結果、周波数スペクトラムの傾斜が緩慢である上に、高いフレームエネルギーが一定の区間以上連続して持続する程度が所定のレベル未満である場合に、モード決定器は、符号化モードを時間ベース符号化モードとして決定するS580。」)

キ「[83] (略)Referring to FlG. 7, an adaptive time and/or frequency audio decoding apparatus 700 effectively decodes an encoded bit stream received by a bit stream input unit 710. The bit stream input unit 710 generates time-based encoded data S5, frequency-based encoded data S6, frequency domain division information S3, and encoding mode information S4 which are output to decoding unit 720. Decoding unit 720 decodes the time and/or frequency based encoded data using the frequency domain division information and the encoding mode information for each frequency band and outputs a decoded audio signal.」
(「【0069】
適応的時間/周波数ベース複号化装置700は、符号化したビットストリームを効率的に複号化することができる。ビットストリーム入力部710は、時間ベース符号化データS5、周波数ベース符号化データS6、周波数領域分割情報S3、および符号化モード情報S4を生成することができる。ビットストリーム入力部710は、S5、S6、S3、およびS4を複号化部720に出力することができる。
【0070】
複号化部720は、周波数領域分割情報S3および符号化モード情報S4を用いて時間ベース符号化データS5および周波数ベース符号化データS6を複号化することができる。このとき、符号化モード情報S4は、分割した周波数帯域それぞれの符号化モード情報を含むことができる。複合化部720は、分割した周波数帯域それぞれの符号化データを複号化することができる。」)

(ア)上記ア、カの記載によれば、引用例1において、aacPlusなどのオーディオコーデックは、圧縮対象が音声信号である場合には、音声コーデック方式の圧縮結果物よりも音質が大きく低下すること、この反面、AMR-WBなどの音声発声モデルを適用したコーデックは、圧縮対象がオーディオ信号の場合には、オーディオコーデック方式の圧縮結果物よりも音質が大きく低下するという短所があることを課題とするものであるから、判定される入力オーディオデータの特性,具体的には,モードを決定するために用いられる時間領域特性および周波数領域特性は、入力オーディオデータが、音声信号であるか、オーディオ信号であるかを判定するために用いられるものといえる。

(イ)上記イの記載によれば、引用例1の適応的時間/周波数ベース符号化モード決定装置は、入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する周波数領域特性抽出部と、前記時間領域特性および前記周波数領域特性を用いて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器と、前記周波数バンドそれぞれに対して前記決定された符号化モードで符号化する符号化部と、前記符号化されたデータに対するビットストリーム処理をし、処理されたビットストリームを出力するビットストリーム出力部とを備えるものである。

(ウ)上記ウの「ビットストリーム出力部130は、周波数領域分割に関する情報S3および周波数バンドそれぞれの符号化モード情報S4を用いてビットストリーム処理を行うことができる。」(段落【0018】)の記載、及び上記キの記載によれば、復号化部は、ビットストリーム入力部から符号化モード情報を受け取り、時間ベース符号化データおよび周波数ベース符号化データを復号化するのであるから、引用例1の適応的時間/周波数ベースオーディオ符号化装置のビットストリーム出力部から出力されるビットストリームには、モード決定器により決定される符号化モード情報が含まれるといえる。

(エ)上記オの記載によれば、モード決定器により決定される符号化モードは、フレーム単位に応じて決定されるものと認められる。

以上(ア)ないし(エ)の検討によれば、引用例1には、下記の発明(以下、「引用発明」という。)が記載されていると認められる。

(引用発明)
「入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、前記入力オーディオ信号の周波数領域信号分析を実行して周波数領域特性を生成する周波数領域特性抽出部と、
前記時間領域特性および前記周波数領域特性を用いて、入力オーディオデータが、音声信号であるか、オーディオ信号であるかを判定し、時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器と、
時間ベース符号化モードとして決定された信号を時間ベース符号化し、周波数ベース符号化モードとして決定された信号を周波数ベース符号化し、時間ベース符号化されたデータおよび周波数ベース符号化されたデータを出力する符号化部と、
前記符号化されたデータに対するビットストリーム処理をし、処理されたビットストリームを出力するビットストリーム出力部と、
を含み、
前記ビットストリーム出力部の出力するビットストリームは、フレーム単位に応じて決定される符号化モードを示す符号化モード情報を含む
適応的時間/周波数ベースオーディオ符号化装置。」

(2)引用例2
当審における拒絶の理由に引用した特開2005-107255号公報(以下、引用例2という)には、図面と共に、以下の記載がある。

(ア)「【0013】
本発明のサンプリングレート変換装置は、入力された時間領域信号を周波数領域変換して第1スペクトルを得る変換手段と、得られた第1スペクトルの周波数帯域を拡張する拡張手段と、拡張後の第1スペクトルの拡張された周波数帯域に第2スペクトルを挿入する挿入手段と、を具備する構成を採る。
【0014】
この構成によれば、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号と等価な信号を得ることができる。」
「【0052】
帯域拡張部104は、入力された第1スペクトルS1(k)の周波数k=Na以降に新たなスペクトルを付与できるように新たな領域(周波数帯域)を確保し、第1スペクトルS1(k)の有効周波数帯域を0≦k<Nbに拡張する。この有効周波数帯域を拡張する処理については後ほど詳述する。
【0053】
拡張スペクトル付与部105は、帯域拡張部104にて拡張された周波数帯域に外部から入力される拡張スペクトルS1’(k)(Na≦k<Nb)を付与し、スペクトル情報特定部106に出力する。」
「【0059】
信号の有効周波数帯域は、ナイキスト定理から0?Fx/2となる。このとき、分析長が2・Naであるので、周波数インデックスkの範囲は0≦k<Naとなり、スペクトルSa(k)の周波数解像度はFx/(2・Na)となる。他方、同一信号をサンプリングレートFyへとアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルSb(k)を図3(b)に示すと、信号の有効周波数帯域は0?Fy/2まで拡張されており、周波数インデックスkの範囲は0≦k<Nbとなる。ここで、Nbが(式1)を満足する場合、スペクトルSb(k)の周波数解像度Fy/(2・Nb)は、Fx/(2・Na)と等しくなる。すなわち、帯域0≦k<NaのスペクトルSa(k)とスペクトルSb(k)とは等しくなる。逆の見方をすると、スペクトルSa(k)(0≦k<Na)の帯域をNbまで広げたときのスペクトルSb(k)は、サンプリングFxの信号をサンプリングFyにアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルと一致する、ことを意味する。この原理を利用することにより、時間領域においてアップサンプリングすることなく、アップサンプリングされた信号と等価のスペクトルを得ることができる。
【0060】
このように、サンプリングレート変換部101において、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの有効周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号を周波数変換して求められるスペクトルと等価なスペクトルを得ることができる。」

(3)引用例3
当審における拒絶の理由に引用した国際公開第05/99243号(以下、引用例3という)には、図面と共に、以下の記載がある。

(請求の範囲)
「[1] 送信対象の音声データを、対応可能な複数種類の符号化方式を用いてそれぞれ符号化し、
該符号化された音声データである音声符号化データのうち、少なくとも一つの種類の音声符号化データを送信し、
前記音声符号化データを受信すると、該音声符号化データを、対応可能な複数種類の復号方式の中から該音声符号化データに適切な復号方式で復号し、
前記復号された音声データを音声データ用のバッファへ一時的に格納し、
前記音声データ用のバッファから該音声データを順次読み出して再生する音声通信方法。」
「[8] 送信対象の音声データの標本化周波数を、各符号化方式に対応する標本化周波数にそれぞれ変換する請求項1記載の音声通信方法。」


(4)引用例4
当審における拒絶の理由に引用した特開平08-97726号公報(以下、引用例4という)には、図面と共に、以下の記載がある。

「【0035】
【実施例】以下、この発明の実施例を添付図面に基づいて説明する。図1はこの発明に係るサブバンド分割/合成装置の要部ブロック構成図、図2はこの発明に係るサブバンド分割/合成装置の分割周波数帯域説明図、図3はこの発明に係るサブバンド分割/合成装置のフィルタ係数特性図および周波数応答特性図、図4はこの発明に係るサブバンド分割/合成装置のサブバンド周波数特性図である。
【0036】図1において、サブバンド分割/合成装置1は、サブバンド分割装置2およびサブバンド合成装置3を備える。サブバンド分割装置2は、ハイパスフィルタ(HPF-1)とローパスフィルタ(LPF-1)と、ローパスフィルタ(LPF-1)にカスケード接続されたダウンサンプラ(DS-1)を第1のサブバンド分割手段とし、同様の組合せで第2のサブバンド分割手段および第3のサブバンド分割手段を構成する。なお、サブバンド分割手段の段数は必要に応じて増加することができる。」


4.本願発明と引用発明の対比・判断

(1)対比
ア 引用発明の「入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、前記入力オーディオ信号の周波数領域信号分析を実行して周波数領域特性を生成する周波数領域特性抽出部」は、「入力信号の特性を分析する入力信号分析部」といえる。

イ 引用発明の「モード決定器」は、前記時間領域特性および前記周波数領域特性を用いて、入力オーディオデータが、音声信号であるか、オーディオ信号であるかを判定し、時間ベース符号化モードまたは周波数ベース符号化モードを決定するから、「前記入力信号が音声特性を有する信号であるか音楽特性を有する信号であるかに応じて符号化方式を決定」するものといえるが、「入力信号の入力ビット率」を用いて符号化方式を決定するものではない。

ウ 引用発明の「符号化部」は、決定された符号化モードに応じて「時間ベース符号化」、「周波数ベース符号化」するが、これらの符号化は、それぞれ本願発明の「音声信号符号化」、「音楽信号符号化」に対応するものであり、引用発明の「符号化部」のうち、それぞれの符号化を行う部分を「音声符号化モジュール」「音声符号化部」、及び「音楽符号化モジュール」、「音楽符号化部」と呼称することが可能であることは明らかである。ただし、本願発明は、「周波数帯域拡張部」を備えた上で、「音声信号符号化部」、「音楽信号符号化部」は、「入力信号で周波数帯域が拡張されないコア帯域」について、符号化するものであるのに対して、引用発明は、「周波数帯域拡張部」を備えるものではないから、引用発明の「符号化部」は、「入力信号」を符号化するものであって、「入力信号で周波数帯域が拡張されないコア帯域」について符号化するものではない。

エ 引用発明の「ビットストリーム出力部」は、本願発明の「ビットストリーム生成部」に対応する。

オ 引用発明のビットストリーム出力部の出力するビットストリームに含まれる「符号化モードを示す符号化ビット情報」は、「入力信号のフレームが音声特性と音楽特性との間で変化する場合、フレーム単位に応じて音声特性と音楽特性との間の変化を示す情報」といえるから、本願発明の「の変化を補償する情報」とは、「変化を示す情報」でいえる点で共通するが、「変化を補償する情報」であることは特定されていない。

上記アないしオによれば、本願発明と引用発明は、
「入力信号の特性を分析する入力信号分析部と、
前記入力信号が音声特性を有する信号であるか音楽特性を有する信号であるかに応じて符号化方式を決定し、
前記入力信号が音声特性を有する信号である場合、音声符号化モジュールを用いて前記入力信号を符号化する音声信号符号化部と、
前記入力信号が音楽特性を有する信号である場合、音楽符号化モジュールを用いて前記入力信号を符号化する音楽信号符号化部と、
前記音声信号符号化部の出力信号および前記音楽信号符号化部の出力信号を用いてビットストリームを生成するビットストリーム生成部と、
を含み、
前記ビットストリーム生成部は、前記入力信号のフレームが音声特性と音楽特性との間で変化する場合、フレーム単位に応じて音声特性と音楽特性との間の変化を示す情報をビットストリームに格納する
音声/音楽統合信号の符号化装置。」

の点で一致し、以下の点で相違している。

[相違点1]
本願発明は、「前記入力信号がステレオ信号である場合、モノラル信号でダウンミックスして、ステレオ音像情報を抽出するステレオ符号化部」を備えるのに対して、引用発明は、「ステレオ符号化部」を備えるものではない点。

[相違点2]
本願発明は、「前記入力信号の周波数帯域を拡張する周波数帯域拡張部」を備えるのに対して、引用発明は、「周波数帯域拡張部」を備えるものではない点。

[相違点3]
本願発明は、符号化方式を決定するにあたり「入力信号の入力ビット率」を用いるものであるのに対して、引用発明は「入力信号の入力ビット率」を用いることは特定されていない点。

[相違点4]
本願発明は、「決定された符号化方式に基づいて前記周波数帯域拡張部の出力信号に対するサンプリング率を決定するサンプリング率変換部」を備え、「前記サンプリング率変換部は、 前記入力信号を1/2にダウンサンプリングする第1ダウンサンプリング部と、前記第1ダウンサンプリング部の出力信号を1/2にダウンサンプリングする第2ダウンサンプリング部と、を含んで」いるのに対して、引用発明は、サンプリング率変換部を備えるものではなく、サンプリング変換部が、このような第1、第2ダウンサンプリング部を備えるものではない点。

[相違点5]
本願発明の「音声信号符号化部」、「音楽信号符号化部」は、「入力信号で周波数帯域が拡張されないコア帯域」を符号化するのに対して、引用発明の「符号化部」は、「入力信号」を符号化するものであって、「入力信号で周波数帯域が拡張されないコア帯域」を符号化するものではない点。

[相違点6]
本願発明の「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する情報」は、「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する」情報であるのに対して、引用発明の「符号化モードを示す符号化ビット情報」は、「変化を補償する」情報であることは特定されていない点。

(2)相違点1ないし6の判断
[相違点1]について
マルチチャネル信号を、より少ないチャネル信号にダウンミックスして符号化することは、例えば、特表2007-531027号(【要約】、段落【0031】参照)、特開2006-325162号公報(段落【0001】、【0003】参照)に記載されているように周知技術にすぎないから、引用発明において、前記入力信号がステレオ信号である場合、モノラル信号でダウンミックスして、ステレオ音像情報を抽出するステレオ符号化部」を備えるようにすることは、当業者が必要に応じてなし得る設計的事項にすぎないものである。

[相違点2]について
上記3.(2)の通り、引用例2には、入力された時間領域の信号の有効周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号と等価な信号を得ることが記載されており、引用発明において、このような「入力信号の周波数帯域を拡張する周波数帯域拡張部」を備えるよう構成することは、当業者が容易になし得ることにすぎない。

「相違点3について」
上記3.(1)(ア)の通り、引用発明は、入力オーディオデータが音声信号であるかオーディオ信号であるかを判定するものであるが、入力信号の入力ビット率が高い場合には、広帯域・高品質の音声信号を伝送可能であり、入力ビット率の高低は、音楽としての特性値の高さを示す指標となり得ることは当業者において明らかであるから、引用発明において、入力オーディオデータが音声信号であるかオーディオ信号であるかを判定するのに、入力信号の入力ビット率をも用いるようにすることに格別の困難性は認められない。

[相違点4について]
上記3.(3)の通り、引用例3には、送信対象の音声データの標本化周波数を、各符号化方式に対応する標本化周波数にそれぞれ変換する音声通信方法が記載されているから、引用発明において「決定された符号化方式に基づいて前記周波数帯域拡張部の出力信号に対するサンプリング率を決定するサンプリング率変換部」を備えることは、当業者が容易になし得ることにすぎない。
そして、サンプリング率変換部に含まれるダウンサンプリング部の具体的な構成として、引用例4に記載されたダウンサンプラを複数段接続した構成を採用して、「入力信号を1/2にダウンサンプリングする第1サンプリング部」と、「第1サンプリング部の出力信号を1/2にダウンサンプリングする第2サンプリング部」とを含める構成とすることも、当業者が適宜なし得る設計的事項にすぎない。

[相違点5について]
装置が備える技術要素のうちの一部や、その出力を使用しないことは、当業者が装置の動作の必要性等に応じて設計的になし得ることであるから、引用発明において、「周波数帯域拡張部」を備えるよう構成した上で、周波数帯域拡張部により周波数拡張された帯域を用いることなく、「入力信号で周波数帯域が拡張されないコア帯域」を符号化するよう構成することは、当業者が必要に応じてなし得る設計的事項にすぎない。
なお、引用発明は、相違点2で認定したとおり「周波数拡張部」を備えるものではないから、引用発明の「符号化部」により符号化される「入力信号」は、「周波数帯域が拡張されない入力オーディオデータ」であり、本願発明の「入力信号で周波数帯域が拡張されないコア帯域」と実質的に相違するものではない。

[相違点6について]
引用発明の「符号化モードを示す符号化ビット情報」は、「変化を補償する」情報であることは特定されていないが、復号に必要な情報であることは明らかである。
そして、符号化モードにおいて、復号に必要な情報であるフレームのサイズ及び方式を示すスーパーフレーム構成を送信することは、当審の平成26年10月17日付け拒絶理由通知書において示したようにAMR-WB又はAMR-WB+によって規格化された周知技術にすぎない。
更に、TCXターゲット信号の変換コーディングに起因するブロッキングアーチファクトを減らす、すなわち「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する」ためのウィンドウウイング及び信号オーバーラップは、送信されたスーパーフレーム構成により得られる現在のフレームのタイプ及びサイズと、過去のフレームのタイプ及びサイズとの両方に依存して決められることも知られている(上記拒絶理由通知書において引用した特表2007-525707号の段落【0092】、【0099】?【0107】参照)ことからみて、復号に必要な情報である「符号化モードを示す符号化ビット情報」を「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する情報」として用いることは、格別なものとは認められない。

そして、本願発明の作用効果も、引用発明、引用例2?4に記載された技術事項、及び周知技術から当業者が予測できる範囲のものである。

(3)審判請求人の主張について
ア 審判請求人の主張の概要
審判請求人は、当審の平成26年10月17日付け拒絶理由通知書に対して提出された平成27年1月21日付けの意見書において、「出願人は、請求項1及び請求項10に、(i)入力信号のフレームが音声特性と音楽特性との間に互いに変換される場合、フレーム間の変換を補償するための情報を補償する情報を利用する点、(ii)入力信号を符号化/復号化する時、周波数帯域が拡張されないコア帯域に対して符号化/復号化する点において、引用文献1?4と差異があるものと思料いたします。」として、本願発明と引用文献との相違について指摘し、各引用文献/参考文献には、本願発明の構成を開示する記載は存在しないため、本願発明は引用文献1?4に記載された発明に基づいて容易になしえたものではない旨主張している。

イ 審判請求人の主張に対する判断
(ア)審判請求人の主張する「相違点(i)」について
復号に必要な情報である「符号化モードを示す符号化ビット情報」を「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する情報」として用いることは、格別なものとは認められないことは、上記2.[相違点6について]に示したとおりである。

ここで、当審の上記拒絶理由通知書における「フレーム単位の変化を補償する情報」について、本願の発明の詳細な説明には、当業者が実施可能な程度に明確かつ十分に記載されていない旨の拒絶理由に対して、審判請求人は上記意見書において、段落[0034]、[0057]、[0037]等の記載を指摘した上で、オーディオ処理に関する当業者であれば十分に理解できる程度に明確に記載されている旨主張している。
審判請求人の指摘するこれらの段落には、「フレーム単位の変化を補償する情報」をどのように用いて、変換を行うものであるかについて具体的な記載が認められないことは、上記拒絶理由通知において指摘したとおりであるが、審判請求人の前記主張は、本願発明は、「復号に必要な情報であるフレームのサイズ及び方式を示す情報」とは異なる「フレーム単位の変化を補償する情報」を用いて、「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する」ものではなく、「復号に必要な情報であるフレームのサイズ及び方式を示す情報」を用いて、「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する」ことを前提とするものと解されるから、本願発明の「フレーム単位に応じて音声特性と音楽特性との間の変化を補償する情報」は、単に「復号に必要な情報であるフレームのサイズ及び方式を示す情報」を言い換えたものにすぎないものと認められる。

(イ)審判請求人の主張する「相違点(ii)」について
上記(2)[相違点5について]に示したように、引用発明において、「周波数帯域拡張部」を備えるよう構成した上で、周波数帯域拡張部により周波数拡張された帯域を用いることなく、「入力信号で周波数帯域が拡張されないコア帯域」を符号化するよう構成することは、当業者が必要に応じてなし得る設計的事項にすぎない。
また、引用発明の「符号化部」により符号化される「入力信号」は、「周波数帯域が拡張されない入力オーディオデータ」であり、本願発明の「入力信号で周波数帯域が拡張されないコア帯域」と実質的に相違するものではないことも上記の通りである。

したがって、審判請求人の上記主張は、採用することができない。


5.むすび

以上のとおり、本願発明は、引用例1に記載された引用発明、引用例2?4に記載された技術事項、及び周知技術に基づいて当業者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができない。

したがって、本願は、その余の請求項について論及するまでもなく拒絶すべきものである。

よって、結論のとおり審決する。
 
審理終結日 2015-02-27 
結審通知日 2015-03-03 
審決日 2015-03-18 
出願番号 特願2011-517359(P2011-517359)
審決分類 P 1 8・ 121- WZ (G10L)
最終処分 不成立  
前審関与審査官 間宮 嘉誉安田 勇太  
特許庁審判長 酒井 朋広
特許庁審判官 丹治 彰
関谷 隆一
発明の名称 音声/音楽統合信号の符号化/復号化装置  
代理人 吉元 弘  
代理人 勝沼 宏仁  
代理人 吉元 弘  
代理人 勝沼 宏仁  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ