• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない。 G10L
管理番号 1262295
審判番号 不服2011-8343  
総通号数 154 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2012-10-26 
種別 拒絶査定不服の審決 
審判請求日 2011-04-19 
確定日 2012-08-22 
事件の表示 特願2006-206931「音声信号のハーモニック成分を用いた有声音/無声音分離情報を抽出する方法及び装置」拒絶査定不服審判事件〔平成19年 2月15日出願公開、特開2007- 41593〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 第1 手続の経緯
本願は、平成18年7月28日の出願(パリ条約による優先権主張2005年(平成17年)8月1日、大韓民国)であって、平成21年11月13日付けの拒絶理由通知に対し、平成22年3月16日付けで手続補正がなされたが、平成22年12月14日付けで拒絶査定がなされ、これに対し、平成23年4月19日に審判請求がなされたものである。

第2 本願発明について
1.本願発明の認定
本願の発明は、平成22年3月16日付け手続補正書により補正された特許請求の範囲の請求項1から21に記載された事項により特定されるものであるところ、その請求項1に係る発明(以下、「本願発明」という。)は、次のとおりのものである。

「音声信号のハーモニック成分を用いた有声音/無声音分離情報抽出方法において、
音声信号が入力されると、周波数ドメインに変換するステップと、
残りエネルギーを最小化するハーモニック係数を計算し、前記ハーモニック係数計算時に必要なピッチ値と前記ハーモニック係数を用いてハーモニック信号を計算するステップと、
前記変換された音声信号から前記ハーモニック信号を除いた残り信号を計算するステップと、
前記計算結果を用いて前記ハーモニック信号と前記残り信号のエネルギー比率を示すHRRを計算するステップと、
前記HRRをしきい値と比較して、有声音/無声音分離を行うステップと
を含むことを特徴とする方法。」

2.刊行物発明
原査定の拒絶の理由で引用された特開平10-20888号公報(以下、「刊行物」という。)には、図面とともに次のア?イの事項が記載されている。 なお、下線は当審で付した。

ア 「【0004】図9に従来の音声符号化・復号化装置の構成を示す。図9において、10は符号化装置、20は復号化装置である。符号化装置10において、1は入力音声信号を入力とし、フレーム音声信号を出力とするバッファである。2はフレーム音声信号を入力とし、ピッチ周波数を出力とするピッチ周波数推定手段である。3はピッチ周波数を入力とし、ピッチ周波数符号を出力とするピッチ周波数符号化手段である。4はフレーム音声信号を入力とし、音声のスペクトルを出力とするスペクトル算出手段である。5はピッチ周波数と音声のスペクトルを入力とし、高調波の振幅と各高調波の有声無声判定を出力とする高調波振幅推定手段である。6は高調波振幅を入力とし、高調波振幅符号を出力とする高調波振幅符号化手段である。7は有声無声判定を入力とし、有声無声判定符号を出力とする有声無声判定符号化手段である。8はピッチ周波数符号と高調波振幅符号と有声無声判定符号を入力とし、多重化符号を出力とするマルチプレクサである。」

イ 「【0006】以上のように構成された音声符号化・復号化装置について、図9、図10を用いてその動作を説明する。はじめに符号化装置の動作を説明する。まず、バッファ1では、入力音声信号を窓関数により切り出してフレーム音声信号として出力する。ピッチ周波数推定手段2では、フレーム音声信号を分析し、ピッチ周波数を推定する。ピッチ周波数の推定方法としては、自己相関やスペクトルなどを用いる手法が知られている。推定されたピッチ周波数は、ピッチ周波数符号化手段3によって符号化され、マルチプレクサ8を介して復号化装置20に送信されるとともに、高調波振幅推定手段5に入力される。スペクトル算出手段4は、フレーム音声信号に対し、離散フーリエ変換などの処理を行い、フレーム音声信号のスペクトルS(w) を求める。高調波振幅推定手段5は、(1)式に示すように、入力された音声スペクトルS(w) と、推定されたピッチ周波数と高調波振幅から合成されるスペクトルS'(w)の誤差E(w) の総和eが最小になるように、高調波の振幅を推定する。
【0007】
【数1】

・・・(1)
【0008】次に、(2)式に示すように、各高調波の近傍において、この誤差を高調波振幅で正規化した誤差が、あるしきい値Thより小さい場合は有声、大きい場合は無声と判定する。
【0009】
【数2】

・・・(2)」

ここで、上記イにおいて、段落【0008】に「(2)式に示すように、各高調波の近傍において、この誤差を高調波振幅で正規化した誤差が、あるしきい値Thより小さい場合は有声、大きい場合は無声と判定する。」と記載されているのに対し、当該(2)式は、右辺の値がしきい値Thより大きい場合に有声、小さい場合(しきい値Th以下の場合)に無声となっており、段落【0008】と逆になっているが、ここでは単に「高調波振幅で正規化した誤差」としきい値を比較することにより、有声か無声かを判定するものとして、刊行物に記載の発明を認定する。

以上の記載から、刊行物には以下の発明(以下、「刊行物発明1」という。)が記載されている。

「符号化装置であって、
入力音声信号を窓関数により切り出してフレーム音声信号として出力するバッファ1、
フレーム音声信号を分析し、ピッチ周波数を推定するピッチ周波数推定手段2、
フレーム音声信号に対し、離散フーリエ変換などの処理を行い、フレーム音声信号のスペクトルS(w) を求めるスペクトル算出手段4、
入力された音声スペクトルS(w) と、推定されたピッチ周波数と高調波振幅から合成されるスペクトルS'(w)の誤差E(w) の総和eが最小になるように、高調波の振幅を推定する高調波振幅推定手段5、
を有し、
高調波振幅推定手段5は、誤差E(w) の総和eを

によって算出し、各高調波の近傍において、

のように、この誤差を高調波振幅で正規化した誤差とあるしきい値Thを比較して、有声又は無声と判定することにより、各高調波の有声無声判定を出力するものである符号化装置。」

また、同刊行物には、次のウの事項も記載されている。

ウ 「【0050】以上のように、本実施の形態3によれば、符号化装置150に、高調波スペクトルと残差スペクトルの比からゲインを求め出力するゲイン算出手段151と、ゲインを符号化するゲイン符号化手段152と、スペクトル残差をスペクトル包絡によって平滑化し、ゲインで正規化して符号化するスペクトル残差符号化手段153を設け、復号化装置160に、ゲイン符号を復号化するゲイン復号化手段162と、スペクトル残差符号を復号化し、スペクトル包絡およびゲインを乗じてスペクトル残差を求めるスペクトル残差復号化手段163を設けることにより、従来各高調波の近傍における正弦波成分と残差成分の比をしきい値により有声あるいは無声という2値で表現していたものを、一般化したゲイン情報として符号化することで、より自由度の高いモデルで符号化でき、品質の良い合成音声が得られる。」

以上の記載から、刊行物には、さらに以下の発明(以下、「刊行物発明2」という。)が記載されている。

「各高調波の近傍における正弦波成分と残差成分の比をしきい値により有声あるいは無声という2値で表現する符号化装置。」

3.対比
本願発明と刊行物発明1とを対比する。
刊行物発明1は、入力音声信号を窓関数により切り出した「フレーム音声信号」に対し、離散フーリエ変換などの処理を行い「フレーム音声信号のスペクトルS(w)」を求めるものであるから、本願発明の「音声信号が入力されると、周波数ドメインに変換するステップ」を含むものである。また、刊行物発明1の「音声スペクトルS(w)」は、本願発明の「変換された音声信号」に相当する。

刊行物発明1の「高調波振幅推定手段5」は、「入力された音声スペクトルS(w) と、推定されたピッチ周波数と高調波振幅から合成されるスペクトルS'(w)の誤差E(w) の総和eが最小になるように、高調波の振幅を推定する」ものであり、これは「音声スペクトルS(w)」と「スペクトルS'(w)」の誤差が「誤差E(w)」であって、「誤差E(w) の総和e」が最小となるように高調波の振幅を推定、すなわち計算することを意味するものである。
ここで、当該「誤差E(w) の総和e」の数式によれば、当該「総和e」は、「入力された音声スペクトルS(w)」から「スペクトルS'(w)」を減算した値の2乗値を0からπまでの周波数領域にわたって積分したものであるから、本願発明の「残りエネルギー」に相当するものであるといえ、「残りエネルギー」である「総和e」を最小化する「スペクトルS'(w)」が求まれば、その時の「音声スペクトルS(w)」と「スペクトルS'(w)」の差分である「誤差E(w)」は、本願発明の「残り信号」に相当するといえる。
そもそも「高調波」と「ハーモニック信号」は同義である。そして、刊行物発明1の「推定されたピッチ周波数と高調波振幅から合成されるスペクトルS'(w)」は、「ピッチ周波数」を用いて計算されるものであり、総和eが最小になるような高調波の振幅値を用いて計算されるものでもあるから、本願発明の「ハーモニック信号」に相当する。
そして、総和eを最小化する高調波の振幅を計算して「スペクトルS'(w)」の値を計算する過程において、「高調波の振幅」を計算することは、「高調波の振幅」を決定づけるための何らかの「係数」、すなわち「ハーモニック係数」を計算しているということができる。
してみると、刊行物発明1の「高調波振幅推定手段5」における上記の一連の処理は、「残りエネルギーを最小化するハーモニック係数を計算し、前記ハーモニック係数計算時に必要なピッチ値と前記ハーモニック係数を用いてハーモニック信号を計算するステップ」であるといえる。

そして、刊行物発明1は、「入力された音声スペクトルS(w) と、推定されたピッチ周波数と高調波振幅から合成されるスペクトルS'(w)の誤差E(w)」を用いて算出される値を用いて有声か無声かの判定を行うものであるから、「前記変換された音声信号から前記ハーモニック信号を除いた残り信号を計算するステップ」を当然含むものである。

更に、刊行物発明1は、これら計算された「スペクトルS'(w)」や「誤差E(w)」を用いて得られる何らかの値をしきい値と比較し、その比較結果により「各高調波の有声無声判定」を行うのであるから、「ハーモニック信号」や「残り信号」の「計算結果を用いて」計算された値を「しきい値と比較して有声音/無声音分離を行う」点で、本願発明と共通する。
そして、刊行物発明1の一連の処理は、「音声信号のハーモニック成分を用いた有声音/無声音分離情報抽出方法」であるといえる。

したがって、本願発明と刊行物発明1は、以下の一致点、相違点を有する。

[一致点]
音声信号のハーモニック成分を用いた有声音/無声音分離情報抽出方法において、
音声信号が入力されると、周波数ドメインに変換するステップと、
残りエネルギーを最小化するハーモニック係数を計算し、前記ハーモニック係数計算時に必要なピッチ値と前記ハーモニック係数を用いてハーモニック信号を計算するステップと、
前記変換された音声信号から前記ハーモニック信号を除いた残り信号を計算するステップと、
前記計算結果を用いて値を計算するステップと、
前記値をしきい値と比較して、有声音/無声音分離を行うステップと
を含むことを特徴とする方法。

[相違点]
有声音/無声音分離を行うためにしきい値と比較する値が、本願発明では「前記ハーモニック信号と前記残り信号のエネルギー比率を示すHRR」であるのに対し、刊行物発明1では(2)式で示される「正規化した誤差」である点。

4.相違点に対する判断
刊行物発明1において、計算結果である「ハーモニック信号」と「残り信号」を用いて計算された、しきい値と比較する「正規化した誤差」は、(2)式、すなわち、

の右辺の分数で表されるように、誤差の「エネルギー」を正規化したものであるといえる。

これに対し、刊行物発明2は、「各高調波の近傍における正弦波成分と残差成分の比をしきい値により有声あるいは無声という2値で表現する」ものである。ここで、「正弦波成分」は「高調波」、すなわち「ハーモニック信号」に対応し、「残差成分」は「残り信号」に対応するといえるから、刊行物発明2は、「ハーモニック信号」と「残り信号」の「比率」を計算し、当該比率をしきい値と比較することにより、有声あるいは無声の判断を行うものであるといえる。また、刊行物発明2の上記「比率」のような波形信号の比率を、(波形振幅の2乗値に比例する)エネルギーの比率によって計算することは、ごく一般的に行われることである。

してみると、刊行物発明1において、有声あるいは無声の判別を行うためにしきい値と比較する値として、「正規化した誤差」の代わりに、刊行物発明2の上記技術を採用して、「ハーモニック信号」と「残り信号」の「エネルギー比率」を用いることにより、本願発明の相違点に係る構成である「前記ハーモニック信号と前記残り信号のエネルギー比率を示すHRR」を用いることは、当業者が容易に想到し得ることである。

したがって、本願発明は、刊行物に記載の刊行物発明1及び刊行物発明2に基づいて当業者が容易に発明をすることができたものである。

第3 まとめ
以上のとおりであるから、本願の請求項1に係る発明は、刊行物に記載の発明に基づいて、当業者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができないとした拒絶査定に誤りはない。

よって、原査定を取り消す、この出願の発明は特許をすべきものとする、との審決を求める審判請求の趣旨は認められないから、結論のとおり審決する。
 
審理終結日 2012-03-23 
結審通知日 2012-03-27 
審決日 2012-04-10 
出願番号 特願2006-206931(P2006-206931)
審決分類 P 1 8・ 121- Z (G10L)
最終処分 不成立  
前審関与審査官 山下 剛史  
特許庁審判長 板橋 通孝
特許庁審判官 古川 哲也
千葉 輝久
発明の名称 音声信号のハーモニック成分を用いた有声音/無声音分離情報を抽出する方法及び装置  
代理人 渡邊 隆  
代理人 実広 信哉  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ