• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 特36条6項1、2号及び3号 請求の範囲の記載不備 特許、登録しない。 G06F
管理番号 1241889
審判番号 不服2008-12420  
総通号数 142 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2011-10-28 
種別 拒絶査定不服の審決 
審判請求日 2008-05-15 
確定日 2011-08-08 
事件の表示 特願2004-316990「機械翻訳技術を使用してパラフレーズを特定するためのシステム」拒絶査定不服審判事件〔平成17年 6月 9日出願公開、特開2005-149494〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 1.手続の経緯
本願は、平成16年10月29日(パリ条約による優先権主張2003年11月12日、アメリカ合衆国)の出願であって、平成20年2月13日付けで拒絶査定がされ、これに対し、同年5月15日に拒絶査定不服審判の請求がされるとともに、同年6月16日付けで手続補正がなされたものである。

2.原査定の理由
一方、原査定の拒絶の理由の概要は、次のとおりである(平成19年10月25日付け拒絶理由通知書より摘記)。
「2.この出願は、特許請求の範囲の記載が下記の点で、特許法第36条第6項第2号に規定する要件を満たしていない。

(1)省略
(2)特許請求の範囲第1項には「前記クラスタからテキストセグメントのセットを選択するステップ」と記載されている。
しかしながら、「テキストセグメント」や「セット」が何を指しているのか、如何なる『技術的思想』でセットを「選択」するのか不明である。
したがって、当該記載では「発明」(自然法則を利用した『技術的思想』の創作)が明確でない。
(3)特許請求の範囲第1項には「テキスト整列を使用して、前記セットの中の前記テキストセグメントにおけるテキスト間のパラフレーズ関係を特定するステップ」と記載されている。
しかしながら、「テキスト整列」とは何なのか、「テキスト整列」を如何なる『技術的思想』で使用して、所望の関係を特定するのか、不明である。
したがって、当該記載では「発明」(自然法則を利用した『技術的思想』の創作)が明確でない。
(4)?(12)省略
(13)特許請求の範囲第6項の記載では、如何なる『技術的思想』でパラフレーズ関係から整列モデルを計算するのか、「整列モデル」が何を指しているのか不明である。
(14)?(24)省略」

3.当審の判断
平成20年6月16日付けの手続補正による補正後の特許請求の範囲の請求項1の記載は、以下のとおりである。
「パラフレーズ処理システムをトレーニングする方法であって、プログラムの実行可能命令を実行するコンピュータの処理装置が、
データベースに記録された複数のドキュメントであって、各々が複数のテキストセグメントを含む複数のドキュメントにアクセスするステップと、
前記ドキュメントに含まれた情報に基づいて、前記複数のドキュメントの中で、共通の主題について書かれた複数の異なるドキュメントを、関連するドキュメントのクラスタとして特定するステップと、
前記特定されたクラスタの各々から、該クラスタの各々の予め定められた部分に位置するテキストセグメントを抽出してグループ化することにより、テキストセグメントのセットを選択するステップと、
統計的機械翻訳におけるテキストの連携技術を使用して、前記選択されたセットの中のテキストセグメントの間で、前記テキストセグメントに含まれた、語彙的に関連する語または句を連携させたリンクを作成し、前記リンクに基づいて前記テキストセグメント間の語または句のパラフレーズ関係を特定するステップと、
特定された前記パラフレーズ関係に基づいて、語または句の連携が生起する確率を含み記憶装置に記憶される整列モデルを計算するステップと、
新たなテキストを入力するステップと、
前記整列モデルに基づいて前記入力された新たなテキストのパラフレーズを生成するステップと
を備えることを特徴とする方法。」

上記補正後の請求項1の記載において、当該発明が明確であるかどうかを検討するに、当審は特に以下の(a)乃至(c)の各記載により規定される各ステップの具体的処理内容が明らかではなく、当該発明は明確でないと判断する。
(a)「前記特定されたクラスタの各々から、該クラスタの各々の予め定められた部分に位置するテキストセグメントを抽出してグループ化することにより、テキストセグメントのセットを選択するステップ」
(b)「統計的機械翻訳におけるテキストの連携技術を使用して、前記選択されたセットの中のテキストセグメントの間で、前記テキストセグメントに含まれた、語彙的に関連する語または句を連携させたリンクを作成し、前記リンクに基づいて前記テキストセグメント間の語または句のパラフレーズ関係を特定するステップ」
(c)「特定された前記パラフレーズ関係に基づいて、語または句の連携が生起する確率を含み記憶装置に記憶される整列モデルを計算するステップ」

(a)について
上記(a)中の「該クラスタの各々の予め定められた部分に位置するテキストセグメント」なる記載では、そこでいう「テキストセグメント」が複数の各ドキュメントに含まれる複数のテキストセグメントの内のどのテキストセグメントなのかを特定することができないから、上記(a)の記載により規定されるステップの具体的処理内容は明確でない。
すなわち、請求項1中の「各々が複数のテキストセグメントを含む複数のドキュメント」なる記載と「複数のドキュメントの中で、共通の主題について書かれた複数の異なるドキュメントを、関連するドキュメントのクラスタとして特定するステップ」なる記載によれば、本願請求項1でいう「クラスタ」は、「各々が複数のテキストセグメントを含む複数のドキュメントの仮想的な集合」であって、その中において各テキストセグメントがどの部分に位置するかを定め得るようなものではないと解するほかはないから、上記「該クラスタの各々の予め定められた部分に位置するテキストセグメント」なる記載では、そこでいう「テキストセグメント」が複数の各ドキュメントに含まれる複数のテキストセグメントの内のどのテキストセグメントなのかを特定することができない。
上記(a)の記載により規定されるステップの具体的処理内容が明らかでないという事情は、発明の詳細な説明を参酌しても変わらない。その理由は以下のとおりである。
発明の詳細な説明には以下の記載がある。
「【0017】
本発明は、一般的なイベントについて書かれた複数の異なる記事(記事のクラスタ)からテキストセグメントのセットを獲得する。次に、そのセットの中のテキストセグメントが、語/句整列技術の適用を受けて、パラフレーズが特定される。デコーダを使用して、テキストセグメントペアからパラフレーズを生成することができる。
【0018】
一実施形態では、テキストセグメントのセットのソースは、互いに極めて近接した期間内に同一のイベントについて書かれた、異なる記事である。テキストセグメントは、例えば、それらの記事から抽出された特定の文であることが可能である。例えば、ほぼ同時に同一のイベントについて書かれたニュース記事の最初の2つの文は、しばしば、非常に似通った情報を含むことが分かっている。したがって、一実施形態では、ほぼ同時に同一のイベントについて書かれた複数の異なる記事の最初の2つの文を一緒にクラスタ化して、文セットのソースとして使用する。もちろん、様々な異なるイベントに関して比較的多数の記事が書かれており、各クラスタが同一のイベントについて書かれた記事のグループを含む、記事の複数のクラスタを形成することもできる。」

「【0039】
クラスタ化システム204は、同一のイベントについて書かれたドキュメントデータベース202の中の記事を特定する。一実施形態では、記事は、ほぼ同時に(必要に応じて、互いに所定の時間閾値内、例えば、1ヶ月内、1週間内、一日内、数時間内などに)書かれていることも特定される。同一のイベントについて(かつ、場合により、ほぼ同時に)書かれていることが特定された記事は、ドキュメントクラスタ218を形成する。このことを図3にブロック216で示している。
【0040】
関連するソース記事がクラスタ218として特定されると、それらの記事の中の所望のテキストセグメント(文、句、見出し、段落など)が抽出される。例えば、ニュース記事における報道関係者の慣習により、記事の最初の1つ、2つの文が、記事の残りの部分の要約を表すべきことが忠告されている。したがって、本発明の一実施形態によれば、記事(例として、異なる報道機関によって書かれている)が、クラスタ218にクラスタ化され、テキストセグメント選択システム206に提供されて、各クラスタ218内で各記事の最初の2つの文が抽出される。この説明は、文に関連して進めているが、これは単に例示であり、その他のテキストセグメントも同じく容易に使用できることに留意されたい。記事の各クラスタ218からの文は、クラスタ化された記事に対応する文セット222として出力される。文セット222は、テキストセグメント選択システム206によって語/句整列システム210に出力される。このことを図3にブロック220で示している。」

上記記載からは、クラスタに含まれる各々のドキュメント(ニュース記事)の最初の二つの文をテキストセグメントとすることが記載されているといえるから、ドキュメントとテキストセグメントとの関係は明らかにされていると認められるものの、クラスタの各々の予め定められた部分については、それらの記載によっても不明なままであるから、上記(a)の記載により規定されるステップの具体的処理内容は依然として明らかではない。

(b)について
上記(b)に記載された「統計的機械翻訳におけるテキストの連携技術」が具体的にどのようなものであって、また該技術を具体的にどのように使用して、テキストセグメント間の語または句のパラフレーズ関係を特定するのか不明である。
統計的機械翻訳については、出願人が平成20年1月30日付け意見書に添付した非特許文献8などの記載から周知技術であると認められるものの、「統計的機械翻訳におけるテキストの連携技術」が何を指しているのかは明確でない。
ここで、「株式会社岩波書店 広辞苑第六版」によれば、「連携」という用語について以下のように説明されている。
「れん‐けい【連携】
同じ目的を持つ者が互いに連絡をとり、協力し合って物事を行うこと。
『両者?して推進する』『?を強める』」

上記「連携」の説明を参酌しても「テキストの連携技術」が指す具体的な内容を想定することができず、よって「統計的機械翻訳におけるテキストの連携技術」の具体的内容が不明であり、さらには該「統計的機械翻訳におけるテキストの連携技術」と「パラフレーズ関係を特定すること」との関係も不明である。そして、上記(b)の記載のみからは、当業者が統計的機械翻訳の周知技術をどのように用いることでパラフレーズ関係を特定することができるのか、その具体的処理の内容を想定することもできない。
したがって、上記(b)「統計的機械翻訳におけるテキストの連携技術を使用して、前記選択されたセットの中のテキストセグメントの間で、前記テキストセグメントに含まれた、語彙的に関連する語または句を連携させたリンクを作成し、前記リンクに基づいて前記テキストセグメント間の語または句のパラフレーズ関係を特定するステップ」の記載では、それにより規定されるステップの具体的処理内容が明らかでない。

そして、上記(b)の記載により規定されるステップの具体的処理内容が明らかでないという事情は、発明の詳細な説明を参酌しても変わらない。その理由は以下のとおりである。
発明の詳細な説明には以下の記載がある。
「【0019】
一実施形態では、次に、記事のクラスタから導出されたテキストセグメントの所与のセットの中のテキストセグメントを、そのセットの中の他のテキストセグメントに対してペアにし、ペアにされたテキストセグメントを入力として与えられて、語/句整列(または機械翻訳)技術を使用してパラフレーズを特定する。語/句整列システムは、通常、異なる言語におけるテキストセグメントを対象にするが、本発明の一実施形態によれば、整列システムは、共通言語におけるテキスト文を対象にする。テキストセグメントは、単に同一の事柄の異なる言い表し方と見なされる。
【0020】
一実施形態では、テキストセグメントセットは、ヒューリスティックな、またはその他のフィルタリング技術を使用してフィルタ処理することができる。さらに別の実施形態では、語/句整列システムにおいてパラフレーズを特定するために生成されるモデルが、後のトレーニングデータにおいてパラフレーズを特定するのにも使用される。
【0021】
本発明の別の実施形態によれば、整列システムによって出力されたパラフレーズおよびモデルを所与として、復号化アルゴリズムを使用してパラフレーズが生成される。」

「【0046】
図4は、語および句が、従来の整列システム210に従って整列された後の、文における語と複数語の句(multiple word phrases)の間の対応を示している。対応のほとんどに関して、統計的整列アルゴリズムが、語と語を結ぶ線で示される、異なるが、並列の情報の間にリンクを確立している。例えば、『storms and tornadoes』という名詞句と『a swarm of tornadoes』という名詞句は、直接には比較できない。したがって、より多くのデータが獲得されるにつれ、『storms』と『swarm』の間のリンク、『storms』と『a』の間のリンクが消えていく。節の順序の相違は、2つの文の間におけるリンク群の交差パターンで見ることができる。
【0047】
1つの例示的な実施形態では、語/句整列システム210は、非特許文献8に記載される技術を使用して実装される。もちろん、他の機械翻訳技術または語/句整列技術を、語と入力テキストの間の関連を特定するために使用することもできる。整列システム210を使用して、整列モデルを構築し、文セットに対して統計的な語および/または句の整列を実行することを、図3にブロック230で示している。」

上記記載によれば、パラフレーズ作成の具体例として図4の二つの文における語又は句を結ぶ線がリンクとして示されているものの、このリンクの作成手順については具体的な記載が無く、また、単に「非特許文献8に記載される技術を使用して実装される」と記載されているのみでは、その具体的処理内容が当業者に直ちに明らかであるとはいえないから、上記(b)の記載により規定されるステップの具体的処理内容は依然として明らかではない。

(c)について
上記(c)に記載された「整列モデル」が具体的に何を指しているのか不明である。
整列モデルについての上記(c)の「特定された前記パラフレーズ関係に基づいて、語または句の連携が生起する確率を含み記憶装置に記憶される整列モデルを計算するステップ」との記載からは、「整列モデル」とは、「パラフレーズ関係」に基づいて計算され、「語または句の連携が生起する確率」を含むものであると規定されているものの、当業者にとって前記記載のみからはその具体的内容が明らかなものではなく、よって上記(c)「特定された前記パラフレーズ関係に基づいて、語または句の連携が生起する確率を含み記憶装置に記憶される整列モデルを計算するステップ」の記載では、それにより規定されるステップの具体的処理内容が明らかでない。
そして、上記(c)の記載により規定されるステップの具体的処理内容が明らかでないという事情は、発明の詳細な説明を参酌しても変わらない。その理由は以下のとおりである。
発明の詳細な説明には以下の記載がある。
「【0048】
次に、語/句整列システム210は、整列された語および句232を、システム210が入力データに基づいて生成した整列モデル234とともに出力する。基本的に、前述した整列システムでは、語の対応を特定するようにモデルがトレーニングされる。整列技術はまず、図4で例示するとおり、テキストセグメントにおける語の間で語の整列を見つける。次に、システムは、整列のそれぞれに確率を割り当て、後のトレーニングデータに基づいてその確率を最適化して、より正確なモデルを生成する。整列モデル234、ならびに整列された語および句232を出力することを、図3にブロック236で示している。
【0049】
整列モデル234は、例として、語整列に割り当てられた翻訳確率、文の中で語または句が移動する確率を示す移動確率、単一の語が、別のテキストセグメントにおける2つの異なる語に対応することが可能な尤度または確率を示す多産性(fertility)確率などの、従来の翻訳モデルパラメータが含まれる。」

上記記載からは「整列モデル」の有する確率が、翻訳確率、移動確率、多産性確率などであることが例示されてはいるものの、整列モデルの具体的な計算方法については依然として不明なままである。また、図4に実際の二つの文を用いた具体的なテキストセグメントの例示はあるものの、単に二つの文の語又は句を線で結んだものが示されているに過ぎず、まして上記整列モデルが有する確率については何ら記載がないから、「語又は句の連携が生起する確率を含む整列モデル」の具体的な計算方法が図4から直ちに導き出されるとはいえない。したがって、上記(c)の記載により規定されるステップの具体的処理内容は依然として明らかではない。

4.むすび
以上のとおり、本願の請求項1に係る発明は明確でない。
したがって、本願は、他の請求項について検討するまでもなく、特許法第36条第6項第2号に規定される要件を満たしていないので拒絶されるべきものである。
よって、結論のとおり審決する。
 
審理終結日 2011-03-10 
結審通知日 2011-03-11 
審決日 2011-03-23 
出願番号 特願2004-316990(P2004-316990)
審決分類 P 1 8・ 537- Z (G06F)
最終処分 不成立  
前審関与審査官 成瀬 博之和田 財太  
特許庁審判長 小曳 満昭
特許庁審判官 池田 聡史
岩崎 伸二
発明の名称 機械翻訳技術を使用してパラフレーズを特定するためのシステム  
復代理人 濱中 淳宏  
代理人 阿部 和夫  
代理人 谷 義一  
復代理人 窪田 郁大  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ