• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない。 G10L
管理番号 1239645
審判番号 不服2009-14207  
総通号数 140 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2011-08-26 
種別 拒絶査定不服の審決 
審判請求日 2009-08-07 
確定日 2011-07-06 
事件の表示 特願2002-560118「音声認識モデルの効率的な記憶のためのシステムおよび方法」拒絶査定不服審判事件〔平成14年 8月 1日国際公開、WO02/59871、平成16年 8月 5日国内公表、特表2004-523788〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 1. 手続の経緯

本願は、平成14年1月10日の国際出願(優先権主張:米国、平成13年1月12日)であって、平成15年8月12日に国際出願翻訳文が提出され、平成18年10月16日付け拒絶理由通知に対して平成21年3月31日付けで拒絶査定がされたものであり、これに対して平成21年8月7日に拒絶査定不服審判が請求されるとともに同日付けで手続補正書が提出されている。

2.本願発明の認定

本願の発明は、平成21年8月7日付け手続補正書により補正された明細書及び図面の記載からみて、その特許請求の範囲の請求項1から請求項18までに記載した事項により特定されるとおりのものと認められるところ、そのうち、請求項1に係る発明は、下記のとおりである。

【請求項1】
音声認識(VR)の方法において、
複数の発話を記録することと、
前記記録された複数の発話の特徴を抽出し、前記複数の発話の抽出された特徴を発生することと、
前記複数の発話の抽出された特徴から複数のVRモデルを作ることと、
前記複数のVRモデルを不可逆圧縮して複数の不可逆圧縮VRモデルを発生することと、
前記抽出した特徴から1つ以上の静止した成分をフィルタリングし、背景雑音および重畳雑音を除去することと、
を備えた方法。
(以下、この請求項1に係る発明を「本願発明」という。)

3.引用刊行物記載の発明

原査定の拒絶の理由は、平成18年10月16日付け拒絶理由通知書により理由Aとして通知した特許法第29条第2項の規定による拒絶理由であり、該理由において引用された刊行物1(特開平7-114395号)には、図面とともに、以下(ア)に示す事項が記載されている。

(ア)「【0011】
【実施例】
図1は、隠れマルコフモデルにより入力する音声データのモデルを作る音声認識システム10を示す。マイクロフォン12に話された語は、増幅器14によって増幅されてアナログ/デジタル(A/D)変換器16に渡される。A/D変換器16は、アナログ音声信号を、特徴フィルタ18に供給される、一続きのデジタルサンプル(標本)に変換する。特徴フィルタ18は、周波数スペクトルの各周波数に対する絶対値(magnitude value )を計算すべくスペクトル分析を実行する既存のアレイプロセッサである。スペクトル分析の既知の方法は、高速フーリエ変換、線形予測符号化、及びケプストラル係数(cepstral coefficients )のような他の音響パラメータテーブル示(acoustic parameterizations)を含む。各口語が多くの10ミリ秒フレームから作られるように、スペクトル分析は、10ミリ秒毎に実行されるのが好ましい。各フレームは、デスクトップパーソナルコンピュータのようなあらゆる既存のコンピュータでありうるデータプロセッサ20へ伝送される。データプロセッサ20は、各入力フレムを受け取りかつ入力フレームをベクトル量子化(VQ)テーブル24におけるコードワードによってテーブルされる多数の音響特徴モデルと比較するコードワード指示装置(codeword designator )22を含む。好ましい実施例において、全ての人間が話す範囲を十分に網羅すべく選ばれたVQテーブル24に200個のコードワードが存在する。入力フレームの音響特徴と最も近接して整合するコードワードがその入力フレームに対応付けられる。そのように、コードワード指示装置22は、連続的なコードワードの間を10ミリ秒の間隔で、各口語に対するコードワードのストリングを出力する。コードワードストリングは、訓練装置(trainer )28または認識装置(recognizer)30のいずれかへ切替装置(switch)26を介して伝送される。訓練装置28は、各語に対して隠れマルコフモデルを計算し、認識装置30は、同じ語の後続の発生を認識すべく隠れマルコフモデルを用いる。訓練装置28は、隠れマルコフモデルをメモリに記憶する。ここで、隠れマルコフモデルは、遷移確率テーブル32、フレーム遷移情報、及び各語に対する特徴出力確率を記憶している出力確率テーブル34を含んでいる。圧縮装置(compressor)36は、以下に詳細に説明するように、出力確率テーブルにおける確率値を圧縮する。口語を認識した上で、認識装置30は、認識した語を、ユーザヘ認識した語をテーブル示する出力(装置)38へ渡す。 」

これを整理すれば、刊行物1には、実質的に次の(イ)なる発明が記載されていることになる。

(イ)音声認識装置において、話された語について特徴フィルタにより音声分析を行い、上記特徴から隠れマルコフモデルを計算することにより多数の音響特徴モデルを作成して出力確率テーブルに記憶し、出力確率テーブルにおける確率値を圧縮する方法が記載されている。
(以下、これを「引用発明」という。)

4.本願発明と引用発明との対比

引用発明における「特徴フィルタにより音声の分析を行い」は、本願発明における「発話の特徴を抽出」に相当する。また引用発明における「特徴から隠れマルコフモデルを計算することにより多数の音響特徴モデルを作成」は、本願発明における「複数のVRモデルを作成」に相当する。
そして、引用発明において、多数の音響特徴モデル(VRモデル)を作成して出力確率テーブルに記憶したものである「出力確率テーブルにおける確率値を圧縮」することは、「複数のVRモデルを圧縮して複数の圧縮VRモデルを発生」することに相当するから、両者は、次の(ウ)の点で一致し、(エ)?(カ)の点で相違する。

[一致点]
(ウ)音声認識(VR)の方法において、
複数の発話の特徴を抽出し、前記複数の発話の抽出された特徴を発生することと、
前記複数の発話の抽出された特徴から複数のVRモデルを作ることと、
前記複数のVRモデルを圧縮して複数の圧縮VRモデルを発生することと、
を備えた方法。

[相違点]
(エ)本願発明が「複数の発話を記録すること」を有し、記憶された発話から特徴抽出を行うのに対し、引用発明は、話された語(発話)について特徴抽出を行うものではあるが、「発話を記録すること」を構成要件とせず、記憶された発話から特徴抽出を行うことについて言及されていない点。

(オ)引用発明は、圧縮について不可逆圧縮であるとはされていない点。

(カ)引用発明は、「抽出した特徴から1つ以上の静止した成分をフィルタリングし、背景雑音および重畳雑音を除去すること」について言及されていない点。

5.相違点の判断

相違点(エ)について検討する。

一般的に音声認識は実時間にて行われることが多いが、実時間にて行われる必要がない場合、音声信号を一度記録しておき、上記記録された音声信号を読み出して、音声認識のための特徴量を得るようにすることも普通に行われている周知事項にすぎない。
平成21年8月28日付けで審尋として通知した前置報告書において提示された周知文献A(特開平7-222248号公報)にも示されているように、本願出願前当業者が適宜採用していた構成であって、一旦記憶された音声信号について認識処理を行うことは設計的事項にすぎない。

相違点(オ)について検討する。

何らかの情報を記憶しておき、これを後に利用するものにおいて、記憶媒体の容量を少なくする、伝送容量を小さくする、あるいは、その後の処理を簡素化するために、情報を格別の問題のない程度に一部を除外することにより情報量を圧縮して記憶することは、情報処理分野における一般的な技術常識であり、周知の手法である。
その一部を除外した情報は完全に復元できない情報であって、そのような周知の手法は非可逆圧縮に他ならない。
音響特徴モデル(すなわちVRモデル)という情報に対しても、重要度の低い情報を省くことにより圧縮することは普通に考慮されることであって、そのような不可逆圧縮をすることに格別の阻害要因はない。
本願発明(請求項1に係る発明)は、圧縮の手法について何ら特定されているものではなく、引用発明において圧縮される情報である音響特徴モデル(すなわちVRモデル)に対して不可逆圧縮とすることは単なる設計的事項にすぎない。

相違点(カ)について検討する。

入力音声から特徴抽出した後、背景ノイズ等を除去することは音声処理における周知の技術である。
例えば、拒絶査定において提示された周知文献イ(特開平06-303689号公報)にも従来技術として記載されている。

上述のとおりであるから、本願発明と引用発明との相違点は、いずれも、当業者が適宜なし得た設計的事項であり、格別なものではない。
そして、これら相違点による本願発明の効果は、個々の相違点の構成自体の有する効果にすぎず、個々の相違点に係る構成の組合せによって新たな効果を奏するものではない。

してみれば、本願請求項1に係る発明は、引用刊行物1に記載された発明において、単に多々の周知技術事項を付加したものであって、該付加に格別の想考困難性は認められない。

6.むすび

以上のとおりであるから、本願発明は、原審において引用された刊行物に記載された発明に基づいて、当業者が容易に発明をすることができたものであり、特許法第29条第2項の規定により特許を受けることができない。
したがって、残る請求項に係る各発明について特に検討することなく、本願は拒絶をすべきものであり、「原査定を取り消す。本願は特許をすべきものである、との審決を求める。」という審判請求の趣旨はこれを認めることができない。

よって、結論のとおり審決する。
 
審理終結日 2011-02-02 
結審通知日 2011-02-08 
審決日 2011-02-21 
出願番号 特願2002-560118(P2002-560118)
審決分類 P 1 8・ 121- Z (G10L)
最終処分 不成立  
前審関与審査官 樫本 剛渡邊 聡  
特許庁審判長 板橋 通孝
特許庁審判官 千葉 輝久
溝本 安展
発明の名称 音声認識モデルの効率的な記憶のためのシステムおよび方法  
代理人 砂川 克  
代理人 岡田 貴志  
代理人 堀内 美保子  
代理人 福原 淑弘  
代理人 峰 隆司  
代理人 河野 直樹  
代理人 中村 誠  
代理人 竹内 将訓  
代理人 山下 元  
代理人 市原 卓三  
代理人 蔵田 昌俊  
代理人 風間 鉄也  
代理人 佐藤 立志  
代理人 河野 哲  
代理人 野河 信久  
代理人 村松 貞男  
代理人 河井 将次  
代理人 勝村 紘  
代理人 幸長 保次郎  
代理人 白根 俊郎  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ