• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない(前置又は当審拒絶理由) G10L
管理番号 1342556
審判番号 不服2016-16161  
総通号数 225 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2018-09-28 
種別 拒絶査定不服の審決 
審判請求日 2016-10-28 
確定日 2018-07-18 
事件の表示 特願2015-516415「シングルチャンネル音声残響除去方法及びその装置」拒絶査定不服審判事件〔平成25年12月27日国際公開、WO2013/189199、平成27年 7月 9日国内公表、特表2015-519614〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 第1 手続の経緯
本願は、2013年(平成25年)4月1日(パリ条約に基づく優先権主張 2012年6月18日 中国(CN))を国際出願日として出願したものであって、平成27年1月30日付けで手続補正がなされ、平成27年5月14日付け拒絶理由通知に対して同年9月17日付けで手続補正がなされ、同年11月5日付け拒絶理由通知に対して平成28年3月31日付けで手続補正がなされたが、同年6月23日付けで拒絶査定がなされた。これに対し、同年10月28日付けで拒絶査定不服審判の請求がなされ、平成29年8月9日付け当審の拒絶理由通知に対して同年11月15日付けで手続補正がなされたものである。


第2 本願発明
本願の請求項1ないし2に係る発明は、平成29年11月15日付け手続補正により補正された特許請求の範囲の請求項1ないし2に記載された事項により特定されるものであるところ、請求項1に係る発明(以下「本願発明」という。)は、次のとおりのものである。

「【請求項1】
入力されたシングルチャンネル音声信号に対してフレーム分割を行い、時間の順に応じてフレーム信号に対して、
現在フレームに対して短時間フーリエ変換を行い、現在フレームのパワースペクトル及び位相スペクトルを獲得する処理と、
現在フレームの前の、現在フレームに至るまでの距離が設定の持続時間範囲内である数フレームを選んで、これらのフレームのパワースペクトルを線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定し、その内、後期反射音の減衰特性に基づいて前記持続時間範囲の上限値を設定し、該持続時間範囲の上限値は0.3s?0.5sの範囲内の値を選択し、及び/又は、音声関連特性及び直接音と早期反射音の残響環境下でのインパルス応答分布領域に基づいて、前記持続時間範囲の下限値を設定し、該持続時間範囲の下限値は50ms?80msの範囲内の値を選択する処理と、
スペクトル減算法によって、現在フレームのパワースペクトルから、推定された現在フレームの後期反射音のパワースペクトルを除去して、現在フレームの直接音及び早期反射音のパワースペクトルを獲得する処理と、
現在フレームの直接音及び早期反射音のパワースペクトルを現在フレームの位相スペクトルとともに、短時間逆フーリエ変換を行い、現在フレーム残響除去後の信号を獲得する処理と、を行うことを含み、
前記の、これらのフレームのパワースペクトルを線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定する処理は、具体的に、下記の数式

(そのうち、R(t,f)は推定された後期反射音のパワースペクトルであり、J_(0)は設定された持続時間範囲内の下限値から得た初期次数であり、J_(AR)は設定された持続時間範囲内の上限値から得たARモデルの次数であり、α_(j,f)はARモデル推定パラメータであり、

は現在フレームよりjフレーム分前のフレームのパワースペクトルであり、Δtはフレームの間隔である。)で表される自己回帰ARモデルを用いて、これらのフレームのパワースペクトルにおける全ての成分を線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定する処理を含み、
或は、下記の数式

(そのうち、R(t,f)は推定された後期反射音のパワースペクトルであり、J_(0)は設定された下限値から得た初期次数であり、J_(MA)は設定された上限値から得たMAモデルの次数であり、β_(j,f)はMAモデル推定パラメータであり、


は現在フレームよりjフレーム分前のフレームの直接音及び早期反射音のパワースペクトルであり、Δtはフレームの間隔である。)で表される移動平均MAモデルを用いて、これらのフレームのパワースペクトルにおける直接音及び早期反射音の成分を線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定する処理を含み、
或は、下記の数式

(そのうち、R(t,f)は推定された後期反射音のパワースペクトルであり、J_(0)は設定された下限値から得た初期次数であり、J_(AR)は設定された上限値から得たARモデルの次数であり、α_(j,f)はARモデル推定パラメータであり、J_(MA)は設定された上限値から得たMAモデルの次数であり、β_(j,f)はMAモデル推定パラメータであり、

は現在フレームよりjフレーム分前のフレームの直接音及び早期反射音のパワースペクトルであり、

は現在フレームよりjフレーム分前のフレームのパワースペクトルであり、Δtはフレームの間隔である。)で表される自己回帰ARモデルを用いて、これらのフレームのパワースペクトルにおける全ての成分を線形重畳加算するとともに、移動平均MAモデルを用いて、これらのフレームのパワースペクトルにおける直接音及び早期反射音の成分を線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定する処理を含む、
ことを特徴とするシングルチャンネル音声残響除去方法。」

以下、上記請求項1に記載された最初のR(t、f)の式を「ARモデルの式」、2番目のR(t、f)の式を「MAモデルの式」、3番目のR(t、f)の式を「ARMAモデルの式」という。


第3 引用文献
平成29年8月9日付け当審の拒絶理由通知で引用された特開2011-65128号公報(以下、「引用文献1」という。)には、「残響除去装置」に関し、図面と共に、以下の事項が記載されている。なお、下線部は当審で付与した。

「【0010】
実施の形態1.
図1はこの発明の実施の形態1による残響除去装置の構成図である。この実施の形態の場合、残響時間が既知であると仮定している。残響時間とは室の平均音響エネルギーが60dB減衰するのにかかる時間である。
図1において残響除去手段2は、入力された音のスペクトル11から既知であると仮定した所与の残響時間12を用いて残響成分を除去した音のスペクトル4を得るためのものである。
残響除去手段2は、重み係数作成手段21と残響成分引き去り手段22を備え、重み係数作成手段21は、所与の残響時間12から重み係数を作成する。残響成分引き去り手段22は、入力された音のスペクトル11のパワースペクトルから、過去に入力されパワースペクトル記憶手段3に記憶されていたパワースペクトルに重み係数作成手段21によって作成された重み係数を掛け合わせたパワースペクトルを残響成分としてSS法により引き去り、残響除去音声のスペクトル4を得る。この残響成分引き去り手段22が、残響除去フィルターを形成する。
【0011】
この発明の原理について説明する。反射音と直接音はインコヒーレントであるためエネルギーの加算が許される。ゆえに残響のある環境では、受音点で観測された音のパワースペクトル(|Xk[i]|^(2))はsフレーム前の音源のパワースペクトル(|Yk[i-s]|^(2))と、現在の音源のパワースペクトル(|Yk[i]^(|2))とによる式(1)のように重み付き和の関係にある。ここでのスペクトルは、あるフレーム幅をフレームシフトfrをもって短時間フーリエ変換を行った結果得られたものとする。
【0012】
【数1】

・・・(1)
【0013】
ここでiは現在のフレーム番号、kはフーリエ変換の次元(0≦k≦N-1)、w[s]は重み係数(0≦s≦i)である。また音源のスペクトルは未知であるので、過去の音源のパワースペクトル|Yk[i-s]|^(2)をパワースペクトル記憶手段3に記憶された過去の観測パワースペクトル(|Xk[i-s]|^(2))で式(2)のように近似する。qは残響成分が重畳することによって増加するエネルギーの割合を示しており、一般に残響時間の関数であると考えられる。
【0014】
【数2】

・・・(2)
【0015】
さらにw[0]=1を仮定して式(1)、(2)より式(3)が導かれる。
【0016】
【数3】

・・・(3)
【0017】
すると式(1)と式(3)のw[s] (1≦s≦i) が同一視でき、重み係数w[s]が残響成分引き去り手段22でSS法に用いる係数そのものとなる。したがって、前記重み係数w[s]が適切に推定できれば、式(3)によってスペクトル記憶手段3に記憶された過去の観測されたパワースペクトル(|Xk[i-s]|^(2))に重み係数w[s]を乗算した積を現在の観測されたパワースペクトル(|Xk[i]|^(2))から引き去ることで残響除去ができる。
この発明は重み係数作成手段21によって前記重み係数w[s]を決定し、式(3)に従い残響成分引き去り手段22で残響を除去するものである。
【0018】
次に具体的な動作について説明する。残響除去を行う前に、重み係数作成手段21によって重み係数w[s]を作成する。残響は減衰の程度に応じて、図7のように反射音が疎な初期残響と反射音の密な後期残響に分けることができ、適用先が音声認識である場合には認識性能に悪影響を与えるのは主に後期残響である。初期残響はさまざまな要因が影響して複雑であるが、後期残響は拡散音場理論に基づき、その室の平均エネルギー密度の時間変化を式(4)の指数関数の形に仮定できる(たとえば、Philip M. Morse and K. Uno Ingard, Theoretical Acoustics, Princeton University Press, 1968, pp. 576-579.を参照)。
・・・(中略)・・・
【0022】
これらを利用すると残響時間RTをあらかじめ決めておけば、式(6)にしたがって重み係数を定めることができる。すなわち重み係数作成手段21は、残響時間RTを入力とし、式(6)にしたがって、重み係数w[s]を計算し出力する。
式(6)は重み係数w[s]を残響減衰の程度によって3区分し、各区間での係数を定めたものである。
・・・(中略)・・・
【0025】
ある点に到来する反射音の時間密度は時間の2乗に比例し、室容積に反比例するため、小規模な室では後期残響への移行は早くに起こる。式(6)において1つ目の条件、すなわち、後期残響に移行するまでの区間は直接音もしくは初期残響であるので、SS法での処理は行わない。自己のフレームに重畳した残響成分はCMN(Cepstrum Mean Normalization)により除かれるので、これは合理的な仮定である。3つめの条件は計算量の低減のために導入したものであり、必ずしも必要なものでないが、例えば30dB減衰した時点で計算を打ち切ると式(6)のようになる。(20dBでも60dBでもかまわない。) これを概念的に表したのが、図8である。室の残響減衰特性は指数的であるが、初期残響の部分は複雑であり音声認識装置に悪影響を与えないので無視する。計算量を削減するため、十分に減衰したと思われる時点で残響除去を打ち切ることができる。
【0026】
次に残響成分引き去り手段22では入力された音のスペクトル11から、パワースペクトル記憶手段3に記憶された過去に入力された音源からのパワースペクトルに重み係数w[s]を掛け合わせた重みつき和を、式(3)にしたがい減算する。音声認識のためであれば、得られたパワースペクトル4 |Yk[i]|^(2) をそのまま音声認識装置に出力する。可聴化のためであれば、元の位相を付加して残響を除去した音声のスペクトル4(|Yk[i]|)を得る。このときSS法による残留のミュージカルノイズを、フィルターを用いて除去することで音質の向上・認識性能の向上を図ることができる。」

上記段落から引用文献1の「残響除去装置」には以下の事項が記載されている。
段落【0010】及び【0017】によれば、入力された音のスペクトルのパワースペクトル(現在の観測されたパワースペクトル)から、過去に入力されたパワースペクトル(過去の観測されたパワースペクトル)を残響成分として引き去り、残響除去音声のスペクトルを得るものである。
段落【0011】によれば、スペクトルは、フレームを短時間フーリエ変換を行ったものである。
段落【0018】及び【0025】によれば、後期残響に移行するまでの区間は直接音もしくは初期残響であるので残響除去は行わず、残響減衰特性が指数的で十分に減衰した時点で残響除去を打ち切るものである。
段落【0016】及び【0017】によれば、残響除去は段落【0016】に記載された下記の式(3)により行うものである。そして、段落【0026】によれば、過去に入力されたパワースペクトルを式(3)にしたがい減算するものである。

・・・(3)
(以下、簡略のため当該式を「式(3)」という。)
段落【0026】によれば、可聴化のためであれば、元の位相を付加して残響除去した音声のスペクトルを得るものである。

よって、引用文献1は残響除去装置に関するものであるが、残響の除去方法として捉まえることができることを踏まえると、引用文献1には下記の発明(以下、「引用発明」という。)が記載されている。

「入力された音のスペクトルのパワースペクトルから、過去に入力されたパワースペクトルを残響成分として引き去り、残響除去音声のスペクトルを得る残響除去方法であって、
スペクトルは、フレームを短時間フーリエ変換を行ったものであり、
後期残響に移行するまでの区間は直接音もしくは初期残響であるので残響除去は行わず、残響減衰特性が指数的で十分に減衰した時点で残響除去を打ち切り、
残響除去は、過去に入力されたパワースペクトルを式(3)にしたがい減算することで行い、
可聴化のため前記減算されたパワースペクトルに元の位相を付加して残響を除去した音声のスペクトルを得る、
残響除去方法。」


第4 対比・判断
本願の請求項1に係る発明(以下「本願発明」という。)と引用発明とを対比する。

ア.引用発明の「入力された音」は、本願発明の「入力された音声信号」に相当する。
また、一般に「フレーム」とは、時間軸に対して音(信号)を分割したものである。そして、音(信号)に対して短時間フーリエ変換を行うことにより、パワースペクトルと位相スペクトルが得られることは技術常識であるところ、引用発明も「可聴化のため前記減算されたパワースペクトルに元の位相を付加して残響を除去した音声のスペクトルを得る」(下線部に注意)から位相もスペクトル化されているといえる。
よって、引用発明の「入力された音のスペクトルのパワースペクトル」、「スペクトルは、フレームを短時間フーリエ変換を行ったものであり」、及び「可聴化のため前記減算されたパワースペクトルに元の位相を付加して残響を除去した音声のスペクトルを得る」ことは、本願発明の「入力された音声信号に対してフレーム分割を行い、時間の順に応じてフレーム信号に対して、現在フレームに対して短時間フーリエ変換を行い、現在フレームのパワースペクトル及び位相スペクトルを獲得する処理」に相当する。
但し、音声信号について、本願発明は「シングルチャンネル」であるのに対し、引用発明はその旨の特定がされていない。

イ.引用発明の「後期残響」は、音声の認識を向上させるために引き去る残響であるから、同様に残響として除去される本願発明の「後期反射音」に相当する。そして、引用発明の「後期残響に移行するまでの区間は直接音もしくは初期残響であるので残響除去は行わず、残響減衰特性が指数的で十分に減衰した時点で残響除去を打ち切り」をすることは、後期残響について影響のある範囲(フレーム)を選択することであるから、本願発明の「現在フレームの前の、現在フレームに至るまでの距離が設定の持続時間範囲内である数フレームを選」ぶことに相当する。
また、引用発明の「後期残響に移行するまでの区間は直接音もしくは初期残響であるので残響除去は行わず」は、後期残響に移行する時点を示しているともいえるので、本願発明の「音声関連特性及び直接音と早期反射音の残響環境下でのインパルス応答分布領域に基づいて、前記持続時間範囲の下限値を設定し」に相当する。そして、引用発明の「残響減衰特性が指数的で十分に減衰した時点で残響除去を打ち切り」は、残響除去をどこでやめるかを示したことだから、本願発明の「後期反射音の減衰特性に基づいて前記持続時間範囲の上限値を設定し」に相当する。
更に、引用発明の「過去に入力されたパワースペクトルを残響成分として引き去」ることは、後期残響について影響のある範囲(フレーム)におけるパワースペクトルを残響成分とすることだから、本願発明の「(現在フレームの前の、現在フレームに至るまでの距離が設定の持続時間範囲内である数フレームを選んで、)これらのフレームのパワースペクトルを線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定」することを含んだものである。
よって、引用発明の「入力された音のスペクトルのパワースペクトルから、過去に入力されたパワースペクトルを残響成分として引き去り、残響除去音声のスペクトルを得る」及び「後期残響に移行するまでの区間は直接音もしくは初期残響であるので残響除去は行わず、残響減衰特性が指数的で十分に減衰した時点で残響除去を打ち切」ることは、本願発明の「現在フレームの前の、現在フレームに至るまでの距離が設定の持続時間範囲内である数フレームを選んで、これらのフレームのパワースペクトルを線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定し、その内、後期反射音の減衰特性に基づいて前記持続時間範囲の上限値を設定し、・・・及び/又は、音声関連特性及び直接音と早期反射音の残響環境下でのインパルス応答分布領域に基づいて、前記持続時間範囲の下限値を設定・・・する処理」及び「スペクトル減算法によって、現在フレームのパワースペクトルから、推定された現在フレームの後期反射音のパワースペクトルを除去して、現在フレームの直接音及び早期反射音のパワースペクトルを獲得する処理」に相当する事項を含んでいる。
なお、この点について、出願人は、審判請求書において「引用文献1では、残響成分を得るプロセスに残響時間を取得する必要がある一方、本願請求項1において、現在フレームの後期反射音のパワースペクトルを推定するプロセスに残響時間(RT60)を推定する必要がないから、引用文献1と本願請求項1の残響除去方法は、いずれもスペクトル減算法を用いてはいるが、現在フレームの後期反射音のパワースペクトルを推定する具体的なプロセスが異なっているため、引用文献1の残響除去方法によっては、本願請求項1のシングルチャンネル音声残響除去における残響時間の推定が難しいという課題が解決できない。」と主張している。しかしながら、本願発明は、「現在フレームの前の、現在フレームに至るまでの距離が設定の持続時間範囲内である数フレームを選んで、これらのフレームのパワースペクトルを線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定し」とあるだけで、残響時間の取得や推定が必要か否かについて特定されているわけではないから、本願の課題が解決できない旨の主張は請求項1の記載に基づいた主張ではない。よって、出願人の主張を採用することはできない。
但し、具体的な上限値又は下限値について、本願発明は「該持続時間範囲の上限値は0.3s?0.5sの範囲内の値を選択、及び/又は、該持続時間範囲の下限値は50ms?80msの範囲内の値を選択」していているのに対し、引用発明はその旨の特定がされていない。

ウ.本願発明は「現在フレームの直接音及び早期反射音のパワースペクトルを現在フレームの位相スペクトルとともに、短時間逆フーリエ変換を行い、現在フレーム残響除去後の信号を獲得する処理」を備えるのに対し、引用発明はその旨の特定がされていない。

エ.本願発明は、後期反射音のパワースペクトルを推定する処理に用いる数式として、「ARモデルの式」、或いは「MAモデルの式」、或いは「ARMAモデルの式」といった選択形式になっているので、以降「ARモデルの式」と引用発明とを対比する。
引用発明の「式(3)の減算されるΣの式」は、ARモデルに適用して後期残響(本願発明の「後期反射音」に相当。)のパワースペクトルを推定したものといえるものの、本願発明の「ARモデルの式」と引用発明の「「式(3)のうち減算されるΣの式」とではパラメータ等で一見すると相違する。

オ.引用発明の「残響除去方法」は、本願発明の「音声残響除去方法」に相当する。

よって、本願発明と引用発明とは以下の点で一致ないし相違する。

<一致点>
入力された音声信号に対してフレーム分割を行い、時間の順に応じてフレーム信号に対して、
現在フレームに対して短時間フーリエ変換を行い、現在フレームのパワースペクトル及び位相スペクトルを獲得する処理と、
現在フレームの前の、現在フレームに至るまでの距離が設定の持続時間範囲内である数フレームを選んで、これらのフレームのパワースペクトルを線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定し、その内、後期反射音の減衰特性に基づいて前記持続時間範囲の上限値を設定、及び/又は、音声関連特性及び直接音と早期反射音の残響環境下でのインパルス応答分布領域に基づいて、前記持続時間範囲の下限値を設定する処理と、
スペクトル減算法によって、現在フレームのパワースペクトルから、推定された現在フレームの後期反射音のパワースペクトルを除去して、現在フレームの直接音及び早期反射音のパワースペクトルを獲得する処理を含む、
ことを特徴とする音声残響除去方法。

<相違点1>
音声信号について、本願発明は「シングルチャンネル」であるのに対し、引用発明はその旨の特定がされていない。

<相違点2>
具体的な上限値又は下限値について、本願発明は「該持続時間範囲の上限値は0.3s?0.5sの範囲内の値を選択、及び/又は、該持続時間範囲の下限値は50ms?80msの範囲内の値を選択」していているのに対し、引用発明はその旨の特定がされていない。

<相違点3>
本願発明は「現在フレームの直接音及び早期反射音のパワースペクトルを現在フレームの位相スペクトルとともに、短時間逆フーリエ変換を行い、現在フレーム残響除去後の信号を獲得する処理」を備えるのに対し、引用発明はその旨の特定がされていない。

<相違点4>
後期反射音のパワースペクトルを推定する処理に用いる数式として、本願発明は「ARモデルの式」を用いているのに対し、引用発明は「式(3)の減算されるΣの式」がARモデルに適用されているもののパラメータ等で一見すると相違する。

そこで、<相違点1>ないし<相違点4>について検討する。
・ <相違点1>について
本願発明(本願明細書の段落【0002】を参照。)も引用発明(引用文献の段落【0074】を参照)も、電話会議の音声通信において通話環境が密閉された空間における残響を除去するためのものであるところ、通話にシングルチャンネル音声を用いることは普通に行われていることだから、引用発明においてもシングルチャンネル音声を用いて相違点1の構成にすることは当業者が容易になし得た事項である。

この点について、出願人は、審判請求書において「引用文献1の図1において、残響除去手段2は、入力された音のスペクトル11から既知であると仮定した所与の残響時間12を用いて残響成分を除去した音のスペクトル4を得るためのものである。従って、引用文献1には、スペクトル減算法を適用した残響除去方法が開示されてはいるが、その残響除去方法がシングルチャンネル音声に対する残響除去方法であるということは開示されていない。引用文献1の実施形態では、残響時間が予め取得できるものだと仮定しているが、シングルチャンネル音声において、モノパスマイクロフォン情報しか利用できないため、その残響時間を推定するのは難しいと思料する。これで分かるように、引用文献1に開示されたのはシングルチャンネル音声に対する残響除去方法ではないと言える。」と主張している。
しかしながら、本願発明は、本願明細書の段落【0032】ないし【0034】に記載されているように、持続時間(残響時間)の上限値(0.3s?0.5s)や下限値(50ms?80ms)を予め設定しており、これにより残響時間は必然的に決定されるから、「モノパスマイクロフォン情報しか利用できないため、その残響時間を推定するのは難しい」点は特段認められないし、引用発明と同様に「既知であると仮定した所与の残響時間」を用いたといえる。よって、出願人の主張は、採用することができない。

・ <相違点2>について
引用文献1に「重み係数w[s]が適切に推定できれば、式(3)によって・・・残響除去ができる。」(段落【0017】)、「残響時間RTをあらかじめ決めておけば、式(6)にしたがって重み係数を定めることができる。」(段落【0022】)、「式(6)において1つ目の条件、すなわち、後期残響に移行するまでの区間は直接音もしくは初期残響であるので、SS法での処理は行わない。・・・(中略)・・・初期残響の部分は複雑であり音声認識装置に悪影響を与えないので無視する。計算量を削減するため、十分に減衰したと思われる時点で残響除去を打ち切ることができる。」(段落【0025)】と記載されているように、引用発明は、本願発明と同様に、「直接音もしくは初期残響の区間の後(本願発明の「持続時間範囲の下限値」に相当。)から、(後期)残響が十分に減衰する時間(本願発明の「持続時間範囲の上限値」に相当。)まで」を残響除去する時間としている。
そして、持続時間範囲の下限値を「50ms?80msの範囲」にすることは、例えば平成29年8月9日付け当審の拒絶理由通知で引用された特開2009-276365号公報(段落【0027】及び【0028】を参照。インパルス応答の残響パターンを、0?65msecが初期反射成分、65msec以降が拡散残響成分とした点。)、特開2009-271359号公報(段落【0036】及び【0037】を参照。インパルス応答の残響パターンを、0?70msecが初期反射成分、70msec以降が拡散残響成分とした点。)に記載されているように周知の技術事項である。
また、持続時間範囲の上限値を「0.3?0.5の範囲」にすることは、例えば平成29年8月9日付け当審の拒絶理由通知で引用された特開2009-42754号公報(段落【0061】を参照。残響時間を0.3秒とした点。)、特開2010-44150号公報(段落【0079】を参照。残響時間を0.5秒とした点。)に記載されているように周知の技術事項である。
ここで、本願発明の「前記持続時間範囲の上限値を設定し、該持続時間範囲の上限値は0.3s?0.5sの範囲内の値を選択し、及び/又は、・・・前記持続時間範囲の下限値を設定し、該持続時間範囲の下限値は50ms?80msの範囲内の値を選択する処理」における「範囲内の値を選択」するとは、上限値を環境の違いで例えば0.3sを選択したり0.5sを選択したり(変化させたり)、又は、下限値を環境の違いで例えば50msを選択したり80msを選択したり(変化させたり)することは、本願明細書に記載されていないので、単に当該範囲内の数値であれば上限値又は下限値として採用することができる程度の意味としか解せない。
よって、引用発明の後期残響が十分に減衰する具体的な時間(上限値)を周知の技術事項(0.3s、0.5s)を採用して相違点2の構成とすること、又は、引用発明の後期残響に移行する具体的な時間(下限値)を周知の技術事項(65ms、70ms)を採用して相違点2の構成とすることは、当業者が容易になし得たことである。

この点について、出願人は、審判請求書において「引用文献1では、残響成分を得るプロセスに残響時間を取得する必要がある。その一方、本願請求項1では、持続時間範囲を予め設定し、現在フレームの前の、現在フレームに至るまでの距離が設定の持続時間範囲内である数フレームを選んで、これらのフレームのパワースペクトルを線形重畳加算して現在フレームの後期反射音のパワースペクトルを推定するようにしており,現在フレームの後期反射音のパワースペクトルを推定するプロセスに残響時間を推定することが不要となる。」、「引用文献1において、残響成分を取得するプロセスは、持続時間範囲を設定することに関わっていないため、本願請求項1の持続時間範囲の上限値と持続時間範囲の下限値を設定するプロセスを開示したものとは言えない。実際に、引用文献1は、残響成分を取得するプロセスでは、残響除去されるべきフレーム数を確定し、即ち、現在フレーム前のどのフレームに対して残響が除去すべきかを確定する必要がある。」と主張している。
しかしながら、確かに引用文献1には残響時間を計算により取得することが記載されているが、計算量を極力減らすことはごく一般的な技術課題であり、上記のとおり、後期残響を示す具体的な時間(上限値又は下限値)が周知である以上、残響時間を計算で求めるのではなく、上限値や下限値を予め設定しておくことは、当業者であれば容易になし得る事項である。よって、出願人の主張を格別なことと認めることはできない。

・ <相違点3>について
引用発明は、「可聴化のため前記減算されたパワースペクトルに元の位相を付加して残響を除去した音声のスペクトルを得る」ところ、音声(信号)を短時間フーリエ変換してスペクトルを得た場合、短時間逆フーリエ変換を行って音声(信号)に戻すものであるから、引用発明(引用文献1)に直接記載がなくても、短時間フーリエ変換を行う記載があれば、短時間逆フーリエ変換を行っているものである。
よって、相違点3は実質的な相違ではない。

・ <相違点4>について
本願発明の「ARモデルの式」は、後期反射音の範囲(J_(0)?J_(AR))を定めてΣ計算を行っており(上限値・下限値について具体的な数値ではない点に注意。)、引用発明の「式(3)の減算されるΣの式」も、上記イで指摘したように「後期残響に移行するまでの区間は直接音もしくは初期残響であるので残響除去は行わず、残響減衰特性が指数的で十分に減衰した時点で残響除去を打ち切」るように範囲を設定し得るから、後期残響の範囲を定めてΣ計算を行っているものである。
そして、本願発明の「ARモデルの式」におけるα_(j,f)は、ARモデル推定パラメータであるところ、本願明細書を参酌してもどのようなものか具体的な記載はないので格別なものとは認められないが、j(フレーム)毎のパラメータであると認められる。一方、引用発明の「式(3)の減算されるΣの式」もARモデルに適用したものであり、重み係数w[s]はs(フレーム)毎のパラメータであるから、ARモデル推定パラメータの一種と認められる。
よって、両者の式に格別な差異は認められないので、相違点4は実質的な相違ではない。

この点について、出願人は、審判請求書において「引用文献1では、ARモデルを音響モデルに適用することが開示されているが、その具体的な物理量および計算プロセスが、本願請求項1とは異なる。本願発明では、上記特徴の係わる物理量及び具体的な数式アルゴリズムによって、残響環境の伝達関数を推定すること、又は残響時間(RT60)を推定することを必要としないという有益な効果が得られるが、このような効果はいずれも引用文献1から示唆を得ることはできない。」と主張している。
しかしながら、物理量とは何を指摘しているのか不明ではあるが、両者とも後期反射音の範囲を定めてΣ計算を行っており(Σ計算における上限値及び下限値は具体的な数値ではない点に注意。)、ARパラメータについても上記で指摘したとおりである。そして、計算プロセス(残響時間の推定)については、両者の式において、残響時間を推定することが必要か否かは示されていないので、この点については請求項1の記載に基づかない主張である。よって、出願人の主張を認めることはできない。

したがって、本願発明は、引用発明により当業者が容易になし得たものである。


第5 むすび
以上のとおり、本願の請求項1に係る発明は、特許法第29条第2項の規定により特許を受けることができない。
したがって、本願は、その余の請求項について論及するまでもなく拒絶すべきものである。
よって、結論のとおり審決する。
 
審理終結日 2018-02-14 
結審通知日 2018-02-20 
審決日 2018-03-08 
出願番号 特願2015-516415(P2015-516415)
審決分類 P 1 8・ 121- WZ (G10L)
最終処分 不成立  
前審関与審査官 冨澤 直樹  
特許庁審判長 井上 信一
特許庁審判官 関谷 隆一
酒井 朋広
発明の名称 シングルチャンネル音声残響除去方法及びその装置  
代理人 西山 春之  
代理人 関谷 充司  
代理人 有原 幸一  
代理人 松島 鉄男  
代理人 奥山 尚一  
代理人 小川 護晃  
代理人 河村 英文  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ