ポートフォリオを新規に作成して保存 |
|
|
既存のポートフォリオに追加保存 |
|
PDFをダウンロード |
審決分類 |
審判 査定不服 2項進歩性 特許、登録しない。 G10L |
---|---|
管理番号 | 1118720 |
審判番号 | 不服2002-19804 |
総通号数 | 68 |
発行国 | 日本国特許庁(JP) |
公報種別 | 特許審決公報 |
発行日 | 2001-02-09 |
種別 | 拒絶査定不服の審決 |
審判請求日 | 2002-10-10 |
確定日 | 2005-06-17 |
事件の表示 | 平成11年特許願第205945号「音声合成方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体」拒絶査定不服審判事件〔平成13年 2月 9日出願公開、特開2001- 34282〕について、次のとおり審決する。 |
結論 | 本件審判の請求は、成り立たない。 |
理由 |
第1 手続の経緯・本願発明 本願は,平成11年7月21日の出願であって,平成14年8月20日付で拒絶査定がなされ,これに対し,同年10月10日に拒絶査定に対する審判請求がなされるとともに,同年11月11日付で手続補正がなされたものである。 平成14年11月11日付の手続補正は,平成14年2月18日付け手続補正書の,請求項3を引用している請求項5を新たな請求項1とするものであり,特許法17条の2第4項4号の明りょうでない記載の釈明を目的とするものに該当し,実質上特許請求の範囲を拡張し,又は変更するものではないので,該訂正は認められる。 したがって,本願の請求項1に係る発明は,特許請求の範囲の請求項1に記載された次のとおりのものと認める。(以下,「本願発明」という。) 「発話者または発話時の感情・状況または発話内容のうちの少なくとも1つが異なる複数の音声合成処理の単位(タスク)にそれぞれ対応した単語辞書,韻律辞書及び波形辞書並びに単語変形規則を用いる音声合成方法であって, 合成すべき文字列とともに入力されるタスクの指定に応じて単語辞書,韻律辞書及び波形辞書並びに単語変形規則を切り替え, 合成すべき文字列を単語変形規則に従って変形処理し, 切り替え後の単語辞書,韻律辞書及び波形辞書を用いて変形処理後の文字列に対応する音声メッセージを合成処理する音声合成方法において, 各辞書が,少なくとも1つの文字を含む単語をそのアクセント型とともに多数収録した単語辞書,該単語辞書に収録された単語に対する韻律を示す韻律モデルデータのうちの代表的な韻律モデルデータを収録した韻律辞書,収録音声を合成単位の音声データとして収録した波形辞書であり,単語変形規則が,文字列の変形規則を収録した単語変形規則である場合,音声合成処理は, 合成すべき文字列のアクセント型を単語辞書または単語変形規則から判定し, 合成すべき文字列とアクセント型に基づいて韻律辞書から韻律モデルデータを選択し, 選択した韻律モデルデータに基づいて合成すべき文字列の各文字に対応する波形データを波形辞書から選択し, 該選択した波形データ同士を接続することにより行う ことを特徴とする音声合成方法。」 第2 引用例 1 引用例1 原査定の拒絶の理由に引用された「音声規則合成装置」と題する特開平8-87289号公報(以下,「引用例1」という。)には,図面と共に次の各記載がある。 ア 「【0002】【従来技術】図4は従来の音声合成システムを示す機能ブロック図である。テキスト解析手段1には漢字かな混じり文等のテキストデータが入力され,ここで,辞書2を用いて形態素解析を行い,品詞の区分,読み(漢字については同字異音の処理も含む),単語のアクセントの付与を行う。音韻制御手段3では上記のようにして与えられた読みに対し,鼻濁音化処理や母音の無声化処理等を施した音韻系列を作る。一方,韻律制御手段4では上記テキスト解析手段で得られた単語のアクセント型から文節のアクセント型の決定やポーズ位置の決定,文全体のイントネーションの決定,あるいは読み上げ速度の決定を行う。 【0003】音声合成手段5は上記のようにして得られる音韻系列と,韻律情報から一連の読み上げ文にする。すなわち,音韻系列や韻律情報に基づいて,合成パラメータ生成部52はパラメータファイル51を参照し,一連の読み上げ文を合成するに必要な合成パラメータを生成する。 【0004】このようにして得られた合成パラメータを用いて,各部分を合成部53で接続合成して目的とするテキストの音声を得ることができる。」 イ 「【0005】すなわち,図5に示すように各個人の声の特徴に合わせた音素ファイル97(図4のパラメータファイル51)を複数用意しておく一方,登場人物情報テーブル96には,甲,乙,…などの登場人物名と,登場人物の年齢,性別,役柄上の出身地,音素ファイル番号等を包含する発声上の特徴を特定できる発声特徴情報とが予め登録されている。」 ウ 「【0013】上記において,更に,上記韻律制御手段4の出力に対して年齢に応じた変更を加える韻律情報変更手段7を備えた構成とするのが好ましい。上記韻律情報変更手段7は,年齢入力部72と該年齢入力部72によって入力された年齢に基づいて韻律変更を行う韻律変更部71と,年齢に対応した韻律情報を収納する語音辞書73を備えた構成とする。」 エ 「【0022】上記においては,元になる音韻と変化後の音韻とを対応させて語音辞書63に記憶させているが,規則性の強い変化,例えば子音脱落,チャ音化作用,ラ行くずれ等は,変化の規則性をプログラム化しておいて一括処理することもできる。例えば,幼児音であれば「○○シャ○○」→「○○チャ○○」,「○○サイ○○」→「○○チャ○○」,「○○ラ○○」→「○○ダ○○」,「○○ロ○○」→「○○ド○○」となるようにプログラム化することになる。これによると,例えば「シャ」に一致する音韻制御手段3よりの入力はすべて「チャ」と変換されることになり,語音辞書63の容量を少なくすることができる。」 オ 「【0024】子供のしゃべる速度は一般に早く,音域は高い。また,老人のしゃべる速度は一般に遅く音域も低い。そこで,上記音韻変更に加えて韻律情報変更手段7で音域,発声速度等の韻律を年齢に合うように修正することが好ましい。すなわち,上記韻律制御手段4の出力は韻律情報変更手段7の韻律変更部71に入力される。この韻律変更部71には年齢入力部72(年齢入力部62と共通)より年齢が入力されており,また,語音辞書73(語音辞書63と共通)には年齢に応じた韻律情報が収納されている。この状態で韻律情報制御手段7より通常の読みに対応する音域,速度等の韻律情報が韻律変更部71に入力された時,該韻律情報変更部71は語音辞書73を参照して,年齢入力部72より入力された年齢に対応した韻律情報に変換することになる。」 2 引用例2 同じく,原査定の拒絶の理由で周知技術として引用された,「電子情報通信学会 技術研究報告 SP96-7 (1996年5月) CHATR:自然音声波形接続型任意音声合成システム」(以下,「引用例2」という。)の「あらまし」の項には,次の記載がある。 カ 「本報告では,話者性や発話様式の特徴を失わずに任意の音声を合成するための方法として,予め録音された音声データベース中の音素単位の音声波形を,何らの信号処理も行わずに接続し,連続音声として出力する方法について述べる。本方式は特徴抽出過程,最適重み決定過程,単位選択過程および波形読み出し過程からなり,言語および話者に依存しない。本方式では音声波形自身は生成せず,所望の合成音声の性質に最も近い音素単位の音声波形を,与えられた音声データベース中から取り出すためのインデックスを作成し,音声出力時にはインデックスに従って音声データベースに直接アクセスし,音声波形を取り出す。最適な音素波形の系列を得るために,前処理として,与えられた音声データについて音素記号と音響的および韻律的な特徴の一覧表を作ると共に,それぞれの特徴に対する最適の重み係数を求めておく必要がある。」 第3 対比 本願発明と引用例1に記載された発明(以下,「引用例1発明」という。)とを比較すると,引用例1発明の辞書2が本願発明の単語辞書に相当し,「語音辞書73(語音辞書63と共通)には年齢に応じた韻律情報が収納されている」(前掲オ)の記載から,本願発明の韻律辞書に相当する語音辞書73も引用例1発明は備えている。 また,引用例1には「変化の規則性をプログラム化しておいて一括処理することもできる」(前掲エ)と記載されていることから,単語変形規則を用いた音声合成方法である点で本願発明と相違は認められない。 さらに,引用例1には音韻系列や韻律情報に基づいて,合成パラメータ生成部52はパラメータファイル51を参照し,文を合成するに必要な合成パラメータを生成し,各部分を合成部53で接続合成して音声を得ることが記載されている。(前掲ア) 以上を踏まえると,両者は次の点で一致し,後記の点で相違している。 1 一致点 「発話者が異なる複数の音声合成処理の単位(タスク)にそれぞれ対応した単語辞書,韻律辞書及び単語変形規則を用いる音声合成方法であって,合成すべき文字列とともに入力されるタスクの指定に応じて単語辞書,韻律辞書及び単語変形規則を切り替え,合成すべき文字列を単語変形規則に従って変形処理し,切り替え後の単語辞書,韻律辞書を用いて変形処理後の文字列に対応する音声メッセージを合成処理する音声合成方法において, 各辞書が,少なくとも1つの文字を含む単語をそのアクセント型とともに多数収録した単語辞書,該単語辞書に収録された単語に対する韻律を示す韻律データを収録した韻律辞書,単語変形規則が,文字列の変形規則を収録した単語変形規則である場合,音声合成処理は,合成すべき文字列のアクセント型を単語辞書または単語変形規則から判定し,合成すべき文字列とアクセント型に基づいて韻律辞書から韻律データを選択し,選択した韻律データに基づいて合成すべき文字列の各文字に対応するデータ同士を接続することにより行うことを特徴とする音声合成方法。」 2 相違点 (1) 本願発明が波形辞書を用いて波形データを接続し,音声合成を行っているのに対し,引用例1には波形辞書及び波形データに関する記載がない点。 (2) 本願発明の韻律辞書が韻律モデルデータのうちの代表的な韻律モデルデータを収録した韻律辞書であるのに対し,引用例1では,語音辞書73には年齢に応じた韻律情報が収納されていることが記載されているのみで代表的なモデルデータを収納したことが明記されていない点。 第4 当審の判断 1 相違点(1)について 音声合成において,音声出力時には音声波形を収納した音声データベースにアクセスし,必要とする音声波形を取り出して,音素波形の系列を得ることは,当業者に周知な技術である。(引用例2の前掲カ) そして,波形を収納した音声データベースが「波形辞書」に相当することは,当業者に自明の事項である。 引用例1においては,図3の音声合成手段5に示されたパラメータファイル51及び合成パラメータ生成部52について「音声合成手段5は上記のようにして得られる音韻系列と,韻律情報から一連の読み上げ文にする。すなわち,音韻系列や韻律情報に基づいて,合成パラメータ生成部52はパラメータファイル51を参照し,一連の読み上げ文を合成するに必要な合成パラメータを生成する。」(前掲ア)との記載のみであるが,前記周知な技術を勘案すると,当業者であれば波形辞書を用いて波形データを接続して音声合成を行っていることは当然に理解できることである。 したがって,当該相違点は,引用例1が当然に備えている機能であり格別なものとはいえない。 2 相違点(2)について 引用例1には,「語音辞書73(語音辞書63と共通)には年齢に応じた韻律情報が収納されている」(前掲オ)記載があり,さらに「韻律情報変更手段7は,年齢入力部72と該年齢入力部72によって入力された年齢に基づいて韻律変更を行う韻律変更部71と,年齢に対応した韻律情報を収納する語音辞書73を備えた構成とする。」(前掲ウ)記載がある。 韻律情報を収納した語音辞書が韻律辞書に相当することは前述のとおりであり,この場合,情報をデータと置き換えて表現することも実質的な意味の相違がないことは自明の事項といえる。 そして,音声合成に用いる辞書においては,すべてのデータを備えることは不可能であり,特定の規則に基づいた代表的なデータを収納していることが普通である。引用例1においても年齢を細分して,年齢に対応した韻律情報に関するすべてのデータを備えることには自ずと限界があり,年齢の範囲を特定して,その範囲で代表的な韻律情報を収納することが当業者の自然な発想と認められる。 したがって,韻律辞書が韻律モデルデータのうちの代表的な韻律モデルデータを収録した韻律辞書であることは,当業者が実施する際に当然に採用する事項であり,係る相違点になんら発明は認められない。 そして,相違点全体をみても当業者が格別推考力を要した点は認められず,また,当業者が予測し得ない格別な効果も認められない。 第5 むすび 以上のとおり,本願発明は,周知技術を参酌することにより,引用例1に記載された発明に基づいて,当業者が容易に発明をすることができたものであるから,他の請求項について検討するまでもなく,本願は,特許法29条2項の規定により特許を受けることができない。 よって,結論のとおり審決する。 |
審理終結日 | 2005-03-01 |
結審通知日 | 2005-03-22 |
審決日 | 2005-04-06 |
出願番号 | 特願平11-205945 |
審決分類 |
P
1
8・
121-
Z
(G10L)
|
最終処分 | 不成立 |
前審関与審査官 | 渡邊 聡 |
特許庁審判長 |
杉山 務 |
特許庁審判官 |
原 光明 橋爪正樹 |
発明の名称 | 音声合成方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体 |
代理人 | 長内 行雄 |
代理人 | 吉田 精孝 |
代理人 | 吉田 精孝 |
代理人 | 長内 行雄 |