• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない(前置又は当審拒絶理由) G06F
管理番号 1218936
審判番号 不服2007-17488  
総通号数 128 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2010-08-27 
種別 拒絶査定不服の審決 
審判請求日 2007-06-21 
確定日 2010-06-21 
事件の表示 特願2002- 19244「言語的にインテリジェントなテキスト圧縮」拒絶査定不服審判事件〔平成14年11月22日出願公開、特開2002-334071〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由
1.手続の経緯

本願は、平成14年1月28日(パリ条約による優先権主張2001年1月26日、米国)の出願であって、平成19年3月20日付けで拒絶査定がなされ、
これに対して、平成19年6月21日に拒絶査定不服審判の請求がなされるとともに、平成19年7月23日付けで手続補正がなされ、
更に、当審において、平成21年10月19日付けで拒絶理由通知書を通知したところ、これに対して、平成22年1月25日付けで手続補正がなされたものである。



2.本願発明

1.本願発明
本願の請求項1に係る発明(以下、「本願発明」という。)は、平成22年1月25日付けの手続補正によって補正された明細書及び図面の記載からみて、特許請求の範囲の請求項1に記載された、次のとおりのものである。

「 【請求項1】 コンピュータを有するデータ処理システムにおいて、複数の単語で構成されるテキストを圧縮するための方法であって、単語の特定の種類に関して、その単語よりも短い単語が予め定められており、前記コンピュータは、
前記テキスト中の各単語を言語解析に基づき単語の種類を解析する解析ステップと、
当該解析により得られる単語の種類が前記特定の種類の1つか否かを判定する判定ステップと、
肯定判定が得られた場合には、テキスト中の特定の種類の各単語を対応の短い単語に置換する置換ステップと、
前記テキスト中の複数の単語で意味をなす特定の単語列についてその中の除去可能な文字列があらかじめ定められており、前記テキスト中の各単語列が除去可能な文字列を含むか否かを判定するステップと、
肯定判定が得られた場合には、前記テキスト中の除去可能な文字列を除去する除去ステップと
を実行し、前記除去可能な文字列は、特定の冠詞、特定の固有名詞、特定の句読点のつながり、特定の音韻を持つ文字であることを特徴とする方法。」



2.引用例1

平成21年10月19日付けの拒絶理由通知書の理由1に引用文献1として引用された、特開平11-345233号公報(以下、「引用例1」という。)には、次の事項が記載されている。

(ア)
「【0001】
【発明の属する技術分野】
本発明は、文書を処理する文書処理方法および装置ならびに文書を処理する文書処理プログラムが記録された記録媒体、詳しくは、文書の要約を表示する要約ウィンドウのサイズに応じて要約を生成するような文書処理方法および装置ならびに記録媒体に関する。」

(イ)
「【0011】
【発明が解決しようとする課題】
このように、自動要約作成システムにより、文書から容易に要約を作成することは可能だが、従来、自動要約作成システムにより作成される要約の情報量は、文書の情報量や、重要度の設定方法などにより決定されていた。例えば、要約が簡略すぎて、文書の概略を把握できないとき、ユーザは、より詳細な要約を参照することができない。
【0012】
本発明は、上述の実情に鑑みて提案されるものであって、ユーザの要求に対応した要約を作成し、提供することができるような文書処理方法および装置、ならびにユーザの要求に対応した要約を作成し、提供することができるような文書処理プログラムが記録された記録媒体を提供することを目的とする。」

(ウ)
「【0016】
【発明の実施の形態】
以下、図面を参照して、本発明に係る文書処理方法および装置ならびに記録媒体の実施の形態について説明する。
【0017】
本発明の実施の形態としての文書処理装置は、図1に示すように、制御部11およびインターフェース12を備える本体10と、ユーザからの入力を受け付けて本体10に送る入力部20と、外部からの信号を受信して本体10に送る受信部21と、サーバ24と本体10との通信を処理する通信部22と、本体10からの出力を表示する表示部30と、記録媒体32に対して情報を記録/再生する記録/再生部31と、ハードディスク33とを有している。」

(エ)
「【0024】
次に、上述のように構成される文書処理装置の動作について説明する。ユーザが入力部15を操作し、インターネット21を介して通信を行うためのプログラムを起動し、サーバ24(サーチエンジン)のURL(Uniform Resource Locator)を入力すると、制御部11は通信部22を制御し、サーバ24にアクセスさせる。このときサーバ24は、インターネット23を介して文書処理装置の通信部22に、検索画面のデータを出力する。CPU13はこのデータを表示部30に出力し、表示させる。ユーザがこの検索画面上で所定のキーワードなどを入力し、検索を指令すると、通信部22から電話回線、インターネット23を介して、サーチエンジンとしてのサーバ34に検索命令が送信される。
【0025】
サーバ24は、検索命令を受けると、この検索命令を実行し、得られた検索結果をインターネット23を介して通信部22に送信する。制御部11は、通信部21を制御し、サーバ23からの検索結果を受信させ、その一部を表示部30に表示させる。いまの場合、サーバ23からは、「TCP」のキーワードを含む各種の情報が送信され、表示部16には、下記に示すような、文書が表示される。」

(オ)
「【0026】
「TCP/IP(Transmission Control Protocol/Internet Protocol)の歴史は、北米の、いや世界のコンピュータネットワークの歴史であるといっても過言ではない。そしてそのTCP/IPの歴史は、ARPANETを抜きにして語ることはできない。ARPANETは正式名称をAdvanced Research Project Agency Network(高等研究計画局ネットワーク)といい、アメリカ国防省DOD(Department of Defence)の国防高等研究計画局(DARPA:Defence Advanced Reserch Project Agency)がスポンサーとなって構築されてきた、実験および研究用のパケット交換ネットワークである。1969年北米西海岸の4箇所の大学、研究機関のホストコンピュータを50kbpsの回線で結んだきわめて小規模なネットワークからARPANETは出発した。
【0027】
当時は1945年に世界初のコンピュータであるENIACがペンシルベニア大学で開発され、1964年にはじめてICを理論素子として実装し、第3世代のコンピュータの歴史を形成したIBMの360シリーズが開発され、やっとコンピュータが産声をあげたばかりあった。この時代背景を考えると、将来のコンピュータ通信の最盛を見越したこのようなプロジェクトは、まさに米国ならではのものであったといえるだろう。」この文書は、その内部構造をタグ付けによる属性情報によって記述されている。文書処理装置における文書処理は、文書に付与されたタグを参照して行われる。本実施の形態においては、文書の構造を示す統語論的タグとともに、多言語間で文書の機械的な内容理解を可能にするような意味的・語用論的タグを文書に付与している。」

(カ)
「【0028】
本実施の形態においては、統語論的なタグ付けとしては、文書のツリー状の内部構造を記述するタグ付けがある。すなわち、本実施の形態においては、図2に示すように、このタグ付けによる内部構造、文書、文、語彙エレメント等の各エレメント、通常リンク、参照・被参照リンク等が、タグとしてあらかじめ文書に付与されている。図中において、白丸“○”は文書の要素すなわちエレメントであり、最下位の白丸は文書における最小レベルの語に対応する、語彙エレメントである。また、実線は語、句、節、文等の文書の構造を示す通常リンク(normal link )である。破線は参照・被参照による係り受け関係を示す参照リンク(reference link)である。文書のタグ付けによる内部構造は、上位から下位への順序で、文書(document)、文書の下位であり段落の上位であるオプションのサブディビジョン(subdivision )、オプションの段落(paragraph)、文(sentence )、文の下位であるサブセンテンシャルセグメント(subsentential segment )、・・・、最下位の語彙エレメントのような階層構造である。
【0029】
本実施の形態においては、意味論・語用論的なタグ付けとしては、係り受け、たとえば代名詞の指示対象、多義語の意味のように統語(syntactic)・意味(semantic)等の情報を記述するタグ付けがある。本実施の形態においては、このようなタグ付けは、HTML(Hyper Text Markup Language)と同様にXML(Extended Markup Language)の形式のタグである。」

(キ)
「【0032】
先に図2で説明したような文書のタグ付けは、図3のウインドウ101に示すように、その統語構造を表示することができる。このウインドウ101においては、右半分103が語彙エレメントを、左半分102が文の構造を示している。
【0033】
このウィンドウ101には、タグ付けされた次に示すような文書が表示されている。この文書においても、タグによって統語構造が記述されている。次に示す文書は、「A氏のB会が終わったC市で、一部の大衆紙と一般紙がその写真報道を自主規制する方針を紙面で明らかにした。」についてのタグ付けによる内部構造を示すものである。
<文書><文><形容動詞句 関係=“場所”><名詞句><形容動詞句 場所=“C市”><形容動詞句 関係=“主語”><名詞句 識別子=“B会”><形容動詞句 関係 “位置”>A氏の</形容動詞句>B会</名詞句>が</形容動詞句>終わった</形容動詞句><地名 識別子=“C市”>C市</地名></名詞句>で、</形容動詞句><形容動詞句 関係=“主語”><名詞句 識別子=新聞" 統語=“並列”><名詞句><形容動詞句>一部の</形容動詞句>大衆紙</名詞句>と<名詞>一般紙</名詞></名詞句>が</形容動詞句><形容動詞句 関係=“目的語”><形容動詞句 関係=“内容” 主語=“新聞”><形容動詞句 関係=“目的語”><名詞句><形容動詞句><名詞 共参照=“B”>そ</名詞>の</形容動詞句>写真報道</名詞句>を</形容動詞句>自主規制する</形容動詞句>方針を</形容動詞句><形容動詞句 関係=“場所”>紙面で</形容動詞句>明らかにした。</文></文書>
この文章においては、「一部の大衆紙と一般紙」のように、統語=“並列”は並列を表す。並列の定義は、係り受け関係を共有すると言うことである。特に何も指定がない場合は、たとえば、<名詞句 関係=x><名詞>A</名詞><名詞>B</名詞></名詞句> はAがBに依存関係のあることを表す。また、関係=x はこの<名詞句>エレメントの関係属性を表している。」

(ク)
「【0034】
続いて、タグ付けにおける、統語、意味、修辞についての相互関係を記述する関係属性について説明する。
【0035】
主語、目的語、間接目的語のような文法機能、動作主、被動作者、受益者などのような主題役割、および理由、結果などのような修辞関係はこの関係属性によって表示する。関係属性は関係=*** という形で表される。本実施の形態では、比較的容易な文法機能、すなわち、主語、目的語、間接目的語のような文における当該語の機能について関係属性を記述する。」

(ケ)
「【0036】
次に、上述のようにタグ付けされた文書を要約する方法について説明する。最初に図4で概略的な流れを示し、後述する図6で詳細に説明する。上記のような文書が表示部30に表示されている状態において、ユーザがその文書の要約を作成したい場合には、入力部20を操作し、自動要約作成モードを指令する。制御部11は、この指令が入力されたときに図4のステップを実行する。」

(コ)
「【0041】
次に、ステップS2において、ユーザが入力部20を操作し、表示領域110の実行ボタン103をオンすると、ステップS3において、制御部11は、所定の規則に基づいて、文書の中の文または単語などをエレメント、すなわち要素として、エレメントそれぞれに重要度を付与して、その重要度とともにRAM14に供給し、記憶させる。重要度の設定方法には、例えば、Zechnerが提案する、単語にtf*idf法で重み付し、文中に出現する単語の重みの総和を文の重要度とする方法や活性拡散を用いる方法などがある。前者の詳細は、下記に示す文献に説明されている。
【0042】
K.Zechner. Fast generation of abstracts from general domain text corpora by extracting relevant sentences. In Proc. of the 16th International Conference on Computational Linguistics, pp.986-989,1996
本実施の形態においては、重要度として、後述するような活性拡散に基づいた中心活性値を採用することにする。
【0043】
なお、重要度の設定方法は、上記した方法以外の方法を利用することもできる。また、表示領域110のキーワード入力部102にキーワードを入力することにより、そのキーワードに基づいた重要度の設定を行うことができる。
【0044】
ステップS4において、制御部11は、表示領域130の表示範囲の大きさを測定し、ステップS5において、その測定結果と予め指定された文字の大きさに基づいて、表示領域130に表示される要約の長さ(例えば、文字数)を決定する。決定された文字数以内であれば、要約は表示領域130を超えて表示されない。
【0045】
次に、ステップS6において、制御部11は、作成される要約が、ステップS5で決定された文字数を超えないように、RAM13から、重要度の高い順に文または単語を選択する。
【0046】
ステップS7において、制御部11は、ステップS6で選択された文または単語をつなぎ合わせて、要約を作成し、表示部16の表示領域130に表示させる。」

(サ)
「【0047】
このようにして、例えば、下記に示すような要約が、表示領域130に表示される。
【0048】
「TCP/IPの歴史は、ARPANETを抜きにして語ることはできない。ARPANETは1969年北米西海岸の4箇所の大学、研究機関のホストコンピュータを50kbpsの回線で結んだ小規模なネットワークからARPANETは出発した。当時は1964年にIBMの360シリーズが開発された。この時代背景を考えると、将来のコンピュータ通信の最盛を見越したこのようなプロジェクトは、まさに米国ならではのものであったといえるだろう。」
ユーザは、文章を一読する代わりに、上記の要約を読み、文章の概要を理解し、文章が所望する情報であるか否かを判定することができる。」

(シ)
「【0109】
【発明の効果】
本発明によれば、表示領域の表示範囲に対応して要約文を作成し、表示するようにしたので、ユーザの要求に対応した要約文を提供することができる。」


以上の引用例1の記載によれば、引用例1には以下の事項が開示されていると認められる。

(a)
引用例1の上記(ア)の
「本発明は、文書を処理する文書処理方法および装置ならびに文書を処理する文書処理プログラムが記録された記録媒体、詳しくは、文書の要約を表示する要約ウィンドウのサイズに応じて要約を生成するような文書処理方法および装置ならびに記録媒体に関する。」という記載、

引用例1の上記(ウ)の
「以下、図面を参照して、本発明に係る文書処理方法および装置ならびに記録媒体の実施の形態について説明する。・・・(中略)・・・本発明の実施の形態としての文書処理装置は、図1に示すように、制御部11およびインターフェース12を備える本体10と、ユーザからの入力を受け付けて本体10に送る入力部20と、外部からの信号を受信して本体10に送る受信部21と、サーバ24と本体10との通信を処理する通信部22と、本体10からの出力を表示する表示部30と、記録媒体32に対して情報を記録/再生する記録/再生部31と、ハードディスク33とを有している。」という記載、
(なお、当該記載から、「サーバ24」、及び「サーバ24」と接続されたコンピュータ、を有する文書処理システムが開示されているといえる。)

引用例1の上記(キ)の
「先に図2で説明したような文書のタグ付けは、図3のウインドウ101に示すように、その統語構造を表示することができる。このウインドウ101においては、右半分103が語彙エレメントを、左半分102が文の構造を示している。・・・」
という記載から、
(なお、当該記載から、「文書」が複数の「語彙エレメント」で構成されていることは自明である。)

引用例1には、
「コンピュータを有する文書処理システムにおいて、複数の語彙エレメントで構成される文書を要約するための方法」
が開示されていると認められる。


(b)
上記(a)の
「コンピュータを有する文書処理システムにおいて、複数の語彙エレメントで構成される文書を要約するための方法」
という開示、

引用例1の上記(キ)の
「先に図2で説明したような文書のタグ付けは、図3のウインドウ101に示すように、その統語構造を表示することができる。このウインドウ101においては、右半分103が語彙エレメントを、左半分102が文の構造を示している。・・・(中略)・・・このウィンドウ101には、タグ付けされた次に示すような文書が表示されている。この文書においても、タグによって統語構造が記述されている。次に示す文書は、「A氏のB会が終わったC市で、一部の大衆紙と一般紙がその写真報道を自主規制する方針を紙面で明らかにした。」についてのタグ付けによる内部構造を示すものである。
<文書><文><形容動詞句 関係=“場所”><名詞句><形容動詞句 場所=“C市”><形容動詞句 関係=“主語”><名詞句 識別子=“B会”><形容動詞句 関係 “位置”>A氏の</形容動詞句>B会</名詞句>が</形容動詞句>終わった</形容動詞句><地名 識別子=“C市”>C市</地名></名詞句>で、</形容動詞句><形容動詞句 関係=“主語”><名詞句 識別子=新聞" 統語=“並列”><名詞句><形容動詞句>一部の</形容動詞句>大衆紙</名詞句>と<名詞>一般紙</名詞></名詞句>が</形容動詞句><形容動詞句 関係=“目的語”><形容動詞句 関係=“内容” 主語=“新聞”><形容動詞句 関係=“目的語”><名詞句><形容動詞句><名詞 共参照=“B”>そ</名詞>の</形容動詞句>写真報道</名詞句>を</形容動詞句>自主規制する</形容動詞句>方針を</形容動詞句><形容動詞句 関係=“場所”>紙面で</形容動詞句>明らかにした。</文></文書>
この文章においては、「一部の大衆紙と一般紙」のように、統語=“並列”は並列を表す。並列の定義は、係り受け関係を共有すると言うことである。特に何も指定がない場合は、たとえば、<名詞句 関係=x><名詞>A</名詞><名詞>B</名詞></名詞句> はAがBに依存関係のあることを表す。また、関係=x はこの<名詞句>エレメントの関係属性を表している。」という記載、

引用例1の上記(ケ)の
「次に、上述のようにタグ付けされた文書を要約する方法について説明する。最初に図4で概略的な流れを示し、後述する図6で詳細に説明する。上記のような文書が表示部30に表示されている状態において、ユーザがその文書の要約を作成したい場合には、入力部20を操作し、自動要約作成モードを指令する。制御部11は、この指令が入力されたときに図4のステップを実行する。」
という記載、

引用例1の上記(コ)の
「【0041】
次に、ステップS2において、ユーザが入力部20を操作し、表示領域110の実行ボタン103をオンすると、ステップS3において、制御部11は、所定の規則に基づいて、文書の中の文または単語などをエレメント、すなわち要素として、エレメントそれぞれに重要度を付与して、その重要度とともにRAM14に供給し、記憶させる。重要度の設定方法には、例えば、Zechnerが提案する、単語にtf*idf法で重み付し、文中に出現する単語の重みの総和を文の重要度とする方法や活性拡散を用いる方法などがある。・・・(中略)・・・次に、ステップS6において、制御部11は、作成される要約が、ステップS5で決定された文字数を超えないように、RAM13から、重要度の高い順に文または単語を選択する。・・・(中略)・・・ステップS7において、制御部11は、ステップS6で選択された文または単語をつなぎ合わせて、要約を作成し、表示部16の表示領域130に表示させる。」という記載から、

引用例1には、
「前記コンピュータは、
前記文書中の各語彙エレメントを統語構造を解析して語彙エレメントの品詞を解析するステップと、
重要度の高い順に語彙エレメントを選択して要約を作成するステップ」を実行すること
が開示されていると認められる。


以上の引用例1の記載によれば、引用例1には下記の発明(以下、「引用例1発明」という。)が開示されていると認められる。

「コンピュータを有する文書処理システムにおいて、複数の語彙エレメントで構成される文書を要約するための方法であって、前記コンピュータは、
前記文書中の各語彙エレメントを統語構造を解析して語彙エレメントの品詞を解析するステップと、
重要度の高い順に語彙エレメントを選択して要約を作成するステップと、
を実行することを特徴とする方法。」



3.引用例2

平成21年10月19日付けの拒絶理由通知書の理由1に引用文献2として引用された、特開平4-90047号公報(以下、「引用例2」という。)には、次の事項が記載されている。

(ア)
「[産業上の利用分野]
本発明は、入力された意味表現から、例えば日本語や英語などの文を生成する文生成方式に関するものである。」
(第1頁右欄第7乃至10行)

(イ)
「[作用]
意味表現より文を生成し、生成結果を評価して、評価が基準を満たさない場合は、生成上の制約を変更して生成を再実行することにより、人間にとって読みやすい文を生成することを可能とする。」
(第2頁右上欄第3乃至8行)

(ウ)
「[実施例]
以下、図面を参照して本発明の詳細な説明する。
第1図は、本発明を適用した自然言語処理装置の一実施例を示すブロック構成図である。
同図において、1は生成するべき文を意味表現の状態で保持する意味表現保持部、2(1)?(n)は文の意味表現を受は取って文を生成する一過程である文生成部、3(1)?(n)は文生成部2(1)?(n)で生成された生成結果を保持しておく結果保持部である。
本実施例では、文生成部2および結果保持部3はそれぞれn個設けられ、最初の文生成部2(1)が与えられた意味表現から生成を行ない、その結果を結果保持部3(1)に保持し、以下、順次各生成部2(m)は前段の結果保持部3(m-1)より生成を行ない、その結果を後段の結果保持部3(m)に保持する(m=2,3,…,n)。特に、結果保持部3(n)は、最終的な出力文が保持される出力文保持部になる。
また、4は各文生成部2の生成過程で生成された中間結果を評価する結果評価部であり、5は結果評価部4が中間結果の読みやすさを評価するための基準値を蓄える評価基準値テーブルである。
更に、6は生成過程によってどのような評価をすべきかを指示する評価タイミングテーブルである。
また、7は一連の文生成の過程を制御する制御部であり、8は生成過程で必要なさまざまな制約を保持している文生成用制約保持部、9は結果評価部4による評価に基づいて文の改良方法を指示する文改良知識を保持している文改良知識群である。」
(第2頁右上欄第9行から同頁右下欄第1行)

(エ)
「この例における評価と再生成の推移を第7図に示す。
まず、最初の生成結果a
『朝から雪が降っており、交通機関が乱れたので、朝遅くまで寝ていた花子は、会社に遅刻した。』
は、43文字となり、評価基準に定められた上限値35文字を越えるので、『文の長さが長い』という評価結果bを得る。この評価に対する文改良知識を第6図に示す。
文改良知識には、どのように文を改良すべきかを表すルールが記入してある。
例えば、『文の長さが長い』場合には、
「助動詞/ムード決定 処理に関しては表層語の短いものを選択する」
とか、
「関係節、強調 処理に関しては入れ子の数を減らす」
といった改良を施せば良いというルールが与えられている。
文改良知識中に書かれたこれらの改良ルールには優先順位がある。」
(第3頁左下欄第8行から同頁右下欄第9行)

(オ)
「ステップs6では、ステップs5で取り出した文改良知識に基づいて、フィードバックをかける先となる生成処理における文生成用の制約を変更する。
この例では、文の長さを短くするために、「連用修飾句決定」処理にフィードバックして、優先順位10の制約『文章意味表現をまとめる』をオンにする文改良ルールが最初に使われる。
ステップs7でフィードバックすべき生成処理を指定して、ステップs2の生成処理(この場合、連用修飾句決定)に戻る。
再び、第4図の意味表現の連用修飾句を見直すと、第7図cのごとく、『朝遅くまで寝ていた』という部分が『寝坊した』に言い換えられることがわかる。この言い換えを行なって再び文を生成する。」
(第3頁右下欄第10行から第4頁左上欄第5行)

(カ)
「新しく生成された文d
『朝から雪が降っており、交通機関が乱れたので、寝坊した花子は、会社に遅刻した。』
は、評価部で再評価される。
今度は、38文字となり、改善は見られるものの、まだ上限値35文字を越えているので『文が長すぎる』と評価される。
その評価結果eから、再び第6図の文改良ルールに従い、今回は、優先順位20の『文中の連接数を1減らす』というルールに従い、意味表現を分割する制約をオンにする。
制約が変更されると、再び、ステップs2に移る。第4図に示す意味表現は、連接を表す『原因』(「遅刻する」と「乱れる」を結ぶもの)で分割される(第7図f)。」
(第4頁左上欄第5乃至19行)

(キ)
「ステップs2では、意味表現を分割することによって、
『朝から雪が降っており、交通機関が乱れた。そのため、朝遅くまで寝ていた花子は、会社に遅刻した。』
という文gを生成する。
そして、生成された文は、再び結果保持部3に移り、評価を受ける。
2つに分割された文は、それぞれ20文字及び26文字となり、長さも適当であるので評価基準を満たしENDとなる(第7図h)。」
(第4頁左上欄第20行から第4頁右上欄第10行)

(ク)
「[他の実施例]
なお、前記実施例において、例文として日本語の文を取りあげたが、英語など、日本語以外の言語を対象にすることも、それぞれの言語に対応する評価基準と、制約及び改良知識を用意することにより、可能となる。」
(第4頁右上欄第11乃至16行)

(ケ)
第6図には、「結果評価部で用いられるルールを示す図」(「4.図面の簡単な説明」の欄)であって、「評価結果」が「文の長さが長い」場合のルールを示す図に関して、
「助動詞/ムード決定」、「接続表現決定」、「連用修飾句決定」、「述部決定」という「生成処理」に対して、「表層語(長/短)」という「自由制約」と、「短い」という「変更値」が設定され、
「連用修飾句決定」という「生成処理」に対して、「文章意味表現をまとめる」という「自由制約」と、「まとめる」という「変更値」が設定された表が図示されている。


以上の引用例2の記載によれば、引用例2には以下の事項が開示されていると認められる。

(a)
引用例2の上記(ア)の
「本発明は、入力された意味表現から、例えば日本語や英語などの文を生成する文生成方式に関するものである。」
という記載、

引用例2の上記(エ)の
「この例における評価と再生成の推移を第7図に示す。
まず、最初の生成結果a
『朝から雪が降っており、交通機関が乱れたので、朝遅くまで寝ていた花子は、会社に遅刻した。』
は、43文字となり、評価基準に定められた上限値35文字を越えるので、『文の長さが長い』という評価結果bを得る。この評価に対する文改良知識を第6図に示す。
文改良知識には、どのように文を改良すべきかを表すルールが記入してある。
例えば、『文の長さが長い』場合には、
「助動詞/ムード決定 処理に関しては表層語の短いものを選択する」
とか、
「関係節、強調 処理に関しては入れ子の数を減らす」
といった改良を施せば良いというルールが与えられている。」
という記載から、
(なお、文が複数の語句から構成されることは自明である。)

引用例2には、
「複数の語句で構成される文の長さを短くするための文生成方式」
が開示されていると認められる。


(b)
引用例2の上記(a)の
「複数の語句で構成される文の長さを短くするための文生成方式」
という開示、

引用例2の上記(エ)の
「この例における評価と再生成の推移を第7図に示す。
・・・(中略)・・・、『文の長さが長い』という評価結果bを得る。この評価に対する文改良知識を第6図に示す。
文改良知識には、どのように文を改良すべきかを表すルールが記入してある。
例えば、『文の長さが長い』場合には、
「助動詞/ムード決定 処理に関しては表層語の短いものを選択する」
とか、
・・・(中略)・・・
といった改良を施せば良いというルールが与えられている。」
という記載、

引用例2の上記(オ)の
「ステップs6では、ステップs5で取り出した文改良知識に基づいて、フィードバックをかける先となる生成処理における文生成用の制約を変更する。
この例では、文の長さを短くするために、「連用修飾句決定」処理にフィードバックして、優先順位10の制約『文章意味表現をまとめる』をオンにする文改良ルールが最初に使われる。
ステップs7でフィードバックすべき生成処理を指定して、ステップs2の生成処理(この場合、連用修飾句決定)に戻る。
再び、第4図の意味表現の連用修飾句を見直すと、第7図cのごとく、『朝遅くまで寝ていた』という部分が『寝坊した』に言い換えられることがわかる。この言い換えを行なって再び文を生成する。」
という記載、

引用例2の上記(ケ)の
「第6図には、「結果評価部で用いられるルールを示す図」(「4.図面の簡単な説明」の欄)であって、「評価結果」が「文の長さが長い」場合のルールを示す図に関して、
「助動詞/ムード決定」、「接続表現決定」、「連用修飾句決定」、「述部決定」という「生成処理」に対して、「表層語(長/短)」という「自由制約」と、「短い」という「変更値」が設定され、
「連用修飾句決定」という「生成処理」に対して、「文章意味表現をまとめる」という「自由制約」と、「まとめる」という「変更値」が設定された表が図示されている」ということから、
(なお、助動詞、接続表現、連用修飾句、述部が、語句によって表現されるもので、これらの種類を表していることは自明である。
また、上記(オ)において、第6図のルール(文改良知識)を、例えば、「助動詞/ムード決定 処理に関しては表層語の短いものを選択する」という読み方で表現できる旨の記載があることを鑑みれば、第6図には、『助動詞/ムード決定 処理に関しては表層語の短いものを選択する』、『接続表現決定 処理に関しては表層語の短いものを選択する』、『連用修飾句決定 処理に関しては表層語の短いものを選択する』、『述部決定 処理に関しては表層語の短いものを選択する』、『連用修飾句決定 処理に関しては文章意味表現をまとめるものを選択する』というルールが開示されているといえる。)

引用例2には、
「語句の特定の種類に関して、その語句よりも短い語句が予め定められており、
『助動詞/ムード決定 処理に関しては表層語の短いものを選択する』、『接続表現決定 処理に関しては表層語の短いものを選択する』、『連用修飾句決定 処理に関しては表層語の短いものを選択する』、又は『述部決定 処理に関しては表層語の短いものを選択する』というルールに該当する場合には、文中の特定の種類の各語句を対応の短い語句に置換する置換ステップと、
『連用修飾句決定 処理に関しては文章意味表現をまとめるものを選択する』というルールに該当する場合には、文中の連用修飾句の意味表現をまとめるステップと、
を実行する」こと
が開示されていると認められる。


以上の引用例2の記載によれば、引用例2には下記の発明(以下、「引用例2発明」という。)が開示されていると認められる。

「複数の語句で構成される文の長さを短くするための文生成方式であって、
語句の種類に関して、その語句よりも短い語句が予め定められており、
『助動詞/ムード決定 処理に関しては表層語の短いものを選択する』、『接続表現決定 処理に関しては表層語の短いものを選択する』、『連用修飾句決定 処理に関しては表層語の短いものを選択する』、又は『述部決定 処理に関しては表層語の短いものを選択する』というルールに該当する場合には、文中の特定の種類の各語句を対応の短い語句に置換する置換ステップと、
『連用修飾句決定 処理に関しては文章意味表現をまとめるものを選択する』というルールに該当する場合には、文中の連用修飾句の意味表現をまとめるステップと、
を実行することを特徴とする文生成方式。」



4.対比

本願発明と引用例1発明とを対比する。

(1)
引用例1発明の「コンピュータを有する文書処理システム」、「語彙エレメント」、「文書」、「要約」、「統語構造を解析して」、「語彙エレメントの品詞」は、それぞれ、

本願発明の「コンピュータを有するデータ処理システム」、「単語」、「テキスト」、「圧縮」、「言語解析に基づき」、「単語の種類」に相当する。


(2)
引用例1発明の
「コンピュータを有する文書処理システムにおいて、複数の語彙エレメントで構成される文書を要約するための方法」は、

本願発明の
「コンピュータを有するデータ処理システムにおいて、複数の単語で構成されるテキストを圧縮するための方法」に相当する。

(3)
引用例1発明の
「前記コンピュータは、
前記文書中の各語彙エレメントを統語構造を解析して語彙エレメントの品詞を解析するステップ」を実行することと、

本願発明の
「単語の特定の種類に関して、その単語よりも短い単語が予め定められており、前記コンピュータは、
前記テキスト中の各単語を言語解析に基づき単語の種類を解析する解析ステップ」を実行することとは、

「前記コンピュータは、
前記テキスト中の各単語を言語解析に基づき単語の種類を解析する解析ステップ」を実行する点で一致し、

本願発明では、「単語の特定の種類に関して、その単語よりも短い単語が予め定められて」いるのに対し、
引用例1発明では、そのようになっていない点、
で相違する。


(4)
引用例1発明の
「重要度の高い順に語彙エレメントを選択して要約を作成するステップ」を実行することと、

本願発明の
「当該解析により得られる単語の種類が前記特定の種類の1つか否かを判定する判定ステップと、
肯定判定が得られた場合には、テキスト中の特定の種類の各単語を対応の短い単語に置換する置換ステップと、
前記テキスト中の複数の単語で意味をなす特定の単語列についてその中の除去可能な文字列があらかじめ定められており、前記テキスト中の各単語列が除去可能な文字列を含むか否かを判定するステップと、
肯定判定が得られた場合には、前記テキスト中の除去可能な文字列を除去する除去ステップと
を実行し、前記除去可能な文字列は、特定の冠詞、特定の固有名詞、特定の句読点のつながり、特定の音韻を持つ文字である」こととは、

・本願発明では、
「当該解析により得られる単語の種類が前記特定の種類の1つか否かを判定する判定ステップと、
肯定判定が得られた場合には、テキスト中の特定の種類の各単語を対応の短い単語に置換する置換ステップ」とを実行するのに対し、
引用例1発明では、そのようなことを実行しない点、

・本願発明では、
「前記テキスト中の複数の単語で意味をなす特定の単語列についてその中の除去可能な文字列があらかじめ定められて」いるものであって、「前記除去可能な文字列は、特定の冠詞、特定の固有名詞、特定の句読点のつながり、特定の音韻を持つ文字である」のに対し、
引用例1発明では、そのようになっていない点、

・本願発明では、
「前記テキスト中の各単語列が除去可能な文字列を含むか否かを判定するステップと、
肯定判定が得られた場合には、前記テキスト中の除去可能な文字列を除去する除去ステップ」とを実行するのに対し、
引用例1発明では、そのようなことを実行しない点、

で相違する。


(5)
したがって、本願発明と引用例1発明とは、

「コンピュータを有するデータ処理システムにおいて、複数の単語で構成されるテキストを圧縮するための方法であって、
前記コンピュータは、
前記テキスト中の各単語を言語解析に基づき単語の種類を解析する解析ステップ
を実行することを特徴とする方法。」

という点で一致し、

(相違点1)
本願発明では、「単語の特定の種類に関して、その単語よりも短い単語が予め定められて」いるのに対し、
引用例1発明では、そのようになっていない点、

そのため、

本願発明では、
「当該解析により得られる単語の種類が前記特定の種類の1つか否かを判定する判定ステップと、
肯定判定が得られた場合には、テキスト中の特定の種類の各単語を対応の短い単語に置換する置換ステップ」とを実行するのに対し、
引用例1発明では、そのようなことを実行しない点、

(相違点2)
本願発明では、
「前記テキスト中の複数の単語で意味をなす特定の単語列についてその中の除去可能な文字列があらかじめ定められて」いるものであって、「前記除去可能な文字列は、特定の冠詞、特定の固有名詞、特定の句読点のつながり、特定の音韻を持つ文字である」のに対し、
引用例1発明では、そのようになっていない点、

そのため、

本願発明では、
「前記テキスト中の各単語列が除去可能な文字列を含むか否かを判定するステップと、
肯定判定が得られた場合には、前記テキスト中の除去可能な文字列を除去する除去ステップ」とを実行するのに対し、
引用例1発明では、そのようなことを実行しない点、


で相違する。



5.相違点の判断

(1)相違点1について

上記「3.引用例2」で検討したように、引用例2には、
「複数の語句で構成される文の長さを短くするための文生成方式であって、
語句の特定の種類に関して、その語句よりも短い語句が予め定められており、
『助動詞/ムード決定 処理に関しては表層語の短いものを選択する』、『接続表現決定 処理に関しては表層語の短いものを選択する』、『連用修飾句決定 処理に関しては表層語の短いものを選択する』、又は『述部決定 処理に関しては表層語の短いものを選択する』というルールに該当する場合には、文中の特定の種類の各語句を対応の短い語句に置換する置換ステップと、 ・・・(中略)・・・
を実行することを特徴とする文生成方式。」
という引用例2発明が開示されている。

このように、短い文を生成すること(一種の圧縮又は要約)という点で、本願発明及び引用例1発明と同様の課題を有する引用例2発明には、
「語句の特定の種類に関して、その語句よりも短い語句が予め定められて」いることや、
各種ルールに基づき、「助動詞/ムード」、「接続表現」、「連用修飾句」、又は「述部」(これらを「単語」で構成するという用法があることは世間常識である。)のような特定の(単語の)種類の1つが文中に存在すると判定された場合には(すなわち、単語の種類が前記特定の(単語の)種類の1つか否かを判定し、肯定判定が得られた場合には)、「文中の特定の種類の各単語を対応の短い語句に置換する」ことが開示されているといえる。

したがって、より的確な圧縮(要約)を行うべく、引用例1発明の、「解析ステップ」で「単語の種類」が解析された「単語」に対して、引用例2発明を適用することによって、
「単語の特定の種類に関して、その単語よりも短い単語が予め定められて」いるようにしたり、
「当該解析により得られる単語の種類が前記特定の種類の1つか否かを判定する判定ステップと、
肯定判定が得られた場合には、テキスト中の特定の種類の各単語を対応の短い単語に置換する置換ステップ」とを実行したりするように構成することは、
当業者が容易に想到し得ることである。


(2)相違点2について

上記「3.引用例2」で検討したように、引用例2には、
「複数の語句で構成される文の長さを短くするための文生成方式であって、
語句の種類に関して、その語句よりも短い語句が予め定められており、
・・・(中略)・・・、『連用修飾句決定 処理に関しては表層語の短いものを選択する』、又は『述部決定 処理に関しては表層語の短いものを選択する』というルールに該当する場合には、文中の特定の種類の各語句を対応の短い語句に置換する置換ステップと、
『連用修飾句決定 処理に関しては文章意味表現をまとめるものを選択する』というルールに該当する場合には、文中の連用修飾句の意味表現をまとめるステップと、
を実行することを特徴とする文生成方式。」
という引用例2発明が開示されている。

このように、短い文を生成すること(一種の圧縮又は要約)という点で、本願発明及び引用例1発明と同様の課題を有する引用例2発明には、
「語句の特定の種類に関して、その語句よりも短い語句が予め定められて」いることや、
各種ルールに基づき、「連用修飾句」又は「述部」(これらを複数の単語で構成して意味を持たせるという用法があること、すなわち、「テキスト中の複数の単語で意味を成す特定の単語列」で構成する用法があることは世間常識である。)がテキスト中に存在すると判定された場合には(すなわち、「テキスト中の複数の単語で意味を成す特定の単語列」を短くすることが出来るか否かを判定し、肯定判定が得られた場合には)、当該「連用修飾句」又は「述部」を短くすることが開示されているといえる。

一方、短い文を生成する方法について検討すると、
「テキスト中の複数の単語で意味をなす特定の単語列」について「前記テキスト中の除去可能な文字列を除去する」方法であって、「前記除去可能な文字列」を「特定の冠詞、特定の句読点のつながり、特定の音韻を持つ文字」とすることは、例えば、

・平成18年10月2日付けの拒絶理由通知書で引用された、欧州特許出願公開第0952533号明細書
(「Fig.4」には、品詞情報を元に、”The big black dog eats the bones on the kitchen floor.”を”dog eats bones on floor.”と要約することが開示されている。すなわち、”dog”、”bones”、”floor”に対して付されていた『the』という「特定の冠詞」がある場合には、『the』を削除することが開示されている。)

・文部省「くぎり符號の使ひ方〔句讀法〕(案)」(昭和二十一年三月)
〔大阪大学大学院文学研究科 国文学・東洋文学講座 岡島昭浩助教授によって、当文献の原文イメージがリンクされたウェブページが、http://www.let.osaka-u.ac.jp/~okajima/hyoki/hugou.htmにて公開されている。〕
(第5頁の「(1)マル」(すなわち『。』)に関して、
「二、「 」(カギ)の中でも文の終止にはうつ(例4)。」
「四、引用語の内容が文の形式をなしてゐても簡單なものにはうたない(例6)。」と記載され、
また、例4として「どちらへ。」「上野まで。」、例6として「「氣をつけ」の姿勢でジーッと注目する。」という用例が記載されている。
すなわち、『。」』という「特定の句読点のつながり」がある場合には、『。』を削除することが可能であることが開示されている。
なお、本願明細書段落【0069】において、「句読点」の例として括弧や引用符も挙げていることから、本願発明における「句読点」とは日本語における『。』(句点)及び『、』(読点)に限定される狭義のものではなく、括弧や引用符を含む広義の「句読点」であることは明らかである。)

・平成19年3月20日付けの拒絶査定の備考の欄で引用された、A.Christoper Upward,CUT SPELLING, A Handbook to the simplification of written English by omission of redundant letters,英国,Simplified Spelling Society,1996年,2nd Edition,p.22-25,43
(第22頁第3乃至23行には、”seven hundred and eighty three”がスペルカットされて”sevn hundred and eity thre”となる例が記載されている。
すなわち、この例では、”seven”や”three”が有する語中母音’e’という「特定の音韻をもつ文字」が削除されている。)

にあるように世間常識である。

また、「テキスト中の複数の単語で意味をなす特定の単語列」について「前記テキスト中の除去可能な文字列を除去する」方法であって、「前記除去可能な文字列」を「特定の固有名詞」とすることは、
「夏目漱石さん」(日本の小説家)を、「漱石」という固有名詞を削除して「夏目さん」と呼んだり、「夏目」という固有名詞を削除して「漱石さん」と呼んだりする(すなわち、姓名という固有名詞のうち、苗字という固有名詞又は名前という固有名詞のどちらかを削除する)という例から理解できるように、世間一般で行われているような、世間常識である。

したがって、より多彩な圧縮(要約)を行うべく、引用例1発明に対して、引用例2発明及び上記世間常識を適用することによって、
「前記テキスト中の複数の単語で意味をなす特定の単語列についてその中の除去可能な文字列があらかじめ定められて」いるものであって、「前記除去可能な文字列は、特定の冠詞、特定の固有名詞、特定の句読点のつながり、特定の音韻を持つ文字である」ものとしたり、
「前記テキスト中の各単語列が除去可能な文字列を含むか否かを判定するステップと、
肯定判定が得られた場合には、前記テキスト中の除去可能な文字列を除去する除去ステップ」とを実行したりするように構成することは、
当業者が容易に想到し得ることである。



6.むすび

したがって、本願発明は、引用例1発明、引用例2発明、及び世間常識に基づいて、当業者が容易に発明をすることができたものであり、特許法29条2項の規定により特許を受けることができないから、本願は拒絶されるべきものである。
 
審理終結日 2010-01-28 
結審通知日 2010-01-29 
審決日 2010-02-09 
出願番号 特願2002-19244(P2002-19244)
審決分類 P 1 8・ 121- WZ (G06F)
最終処分 不成立  
前審関与審査官 浜岸 広明  
特許庁審判長 田口 英雄
特許庁審判官 小曳 満昭
和田 財太
発明の名称 言語的にインテリジェントなテキスト圧縮  
代理人 谷 義一  
代理人 阿部 和夫  
復代理人 窪田 郁大  
  • この表をプリントする

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ