• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない。 G06F
審判 査定不服 特174条1項 特許、登録しない。 G06F
管理番号 1211891
審判番号 不服2009-8820  
総通号数 124 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2010-04-30 
種別 拒絶査定不服の審決 
審判請求日 2009-04-23 
確定日 2010-02-12 
事件の表示 特願2008-186374「データ処理装置、データ処理方法および記録媒体」拒絶査定不服審判事件〔平成20年12月25日出願公開、特開2008-310820〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由
第1 手続の経緯

本願は、平成11年12月9日(優先権主張平成10年12月25日、平成11年9月24日)に出願した特願平11-350479号の一部を平成20年7月17日に新たな特許出願としたものであって、平成21年3月17日付けで拒絶査定がなされ、これに対し、平成21年4月23日に拒絶査定不服審判の請求がなされるとともに、平成21年5月15日付けで手続補正がなされたものである。




第2 平成21年5月15日付けの手続補正についての補正却下の決定

〔結論〕

平成21年5月15日付けの手続補正を却下する。

〔理由〕

1.補正内容

平成21年5月15日付けの手続補正(以下、「本件補正」という。)は、特許請求の範囲を補正するものであって、本件補正によって特許請求の範囲の請求項1は、

「 【請求項1】
複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが、階層的に記述されているデータ構造部と、
前記複数のセグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されている属性部と、
の両方を有し、前記メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データを入力する入力部と、
前記属性部に記述されている前記観点及び前記スコアの少なくとも一つ、または、前記観点及び前記スコアの少なくとも一つと前記時間情報との組み合わせに基づいて、前記データ構造部からセグメントを選択する選択部と、を備え、
前記選択部は、少なくとも前記スコアに基づいてセグメントを選択する際に、最上位階層までの経路上のセグメントの前記スコアの相加平均値を用いるデータ処理装置。」

と補正された。

つまり、本件補正は、
特許請求の範囲の請求項1に「前記選択部は、少なくとも前記スコアに基づいてセグメントを選択する際に、最上位階層までの経路上のセグメントの前記スコアの相加平均値を用いる」という記載を追加することによって、
「最上位階層までの経路上のセグメント」の「『場面の内容を表す少なくとも1つのキーワードによって表される観点』に基づいた各セグメントの重要度を表すスコア」の「相加平均値」を用いることを規定する補正(以下、「本件補正事項」という。)を含むものである。



2.本件補正事項に対する判断

(1)
本出願の願書に最初に添付した明細書、特許請求の範囲又は図面(以下、「本出願当初明細書等」という)には、「相加平均」に関して、以下の記載(なお、下線は当審にて付加)がある。

「【0027】
〔第1の実施の形態〕
以下、本発明に係る第1の実施の形態について述べる。本実施の形態においては、メディアコンテンツとして、MPEG1システムストリームの動画像を想定する。この場合、メディアセグメントは、ひとつのシーンカットに相当する。また本実施の形態において、スコアは、該当する場面における文脈内容に基づいた客観的な重要度とする。
【0028】
・・・(中略)・・・
【0030】
の子要素は、
である。
には、該当場面の文脈内容上の重要度を表すpriorityが属性として付加される。重要度は1から5までの整数値とし、1が最も重要度が低く、5が最も重要度が高い、とする。 【0031】
の子要素は、
である。すなわち、
は、それ自身を子要素としても良いとする。ただし、ひとつの
の子要素として、
を混在させてはならないこととする。
【0032】
は、ひとつのシーンカットを表し、
と同様のpriorityと、該当シーンの時間情報として、開始時間を表すstartと、終了時間を表すendとが、属性として付加される。シーンカットの方法は、市販されていたり、ネットワークで流通しているソフトを用いても良いし、人手で行っても良い。なお、本実施の形態では、時間情報をシーンカットの開始時間と終了時間としたが、時間情報として開始時間と該当シーンの継続時間としても同様の効果が得られる。この場合、該当シーンの終了時間は、開始時間に継続時間
を加算して求められる。」

「【0048】
〔第2の実施の形態〕
以下、本発明に係る第2の実施の形態について述べる。本実施の形態は、第1の実施の形態と比較して、選択ステップの処理のみが異なるものである。
【0049】
以下、図を参照しながら本実施の形態における選択ステップ101の処理について記述する。本実施の形態における選択ステップ101では、最上位の
から葉であるまですべてのpriorityを利用する。
の各々のpriorityは、文脈内容における客観的な重要度とする。この処理を図31を参照しながら説明する。図31において、1301は文脈内容記述データにおける最上位の
のうちのひとつである。1302は
1301の子要素
である。1303は
1302の子要素
である。1304は
1303の子要素である。本実施の形態における選択ステップ101では、から祖先である最上位の
までの経路上すべてのpriorityの相加平均をとり、その値がしきい値以上のを選択する。図28の例では、1304と、
1303と、
1302と、
1301との、それぞれの属性priorityの値p4,p3,p2,p1の相加平均paを計算する。paは以下の式(4)によって求められる。
【0050】
pa=(p1+p2+p3+p4)/4 ・・・(4)
【0051】
このpaとしきい値との比較を行い(S1、S2)、paがしきい値以上であれば1304を選択し(S3)、1304の属性startとendの値を、選択された場面の開始時間と終了時間として出力する(S4)。以上の処理をすべてのに対して行う(S1、S6)。図32に、本実施の形態における選択ステップ101の処理のフローチャートを示す。
【0052】
なお、本実施の形態では、から祖先である最上位の
までのpriorityの相加平均を算出して、それによりの選択を行ったが、これを、を子要素としてもつ
から祖先である最上位の
までのpriorityの相加平均をとって、しきい値処理により、を子要素として持つ
の選択を行っても良い。同様に、他の階層の
から祖先である最上位の
までの相加平均をとって、しきい値処理により、その階層の
の選択を行っても良い。」

「【0053】
〔第3の実施の形態〕
以下、本発明に係る第3の実施の形態について述べる。本実施の形態も、第1の実施の形態と比較して、選択ステップの処理のみが異なるものである。 【0054】
以下、図を参照しながら本実施の形態における選択ステップ101の処理について記述する。本実施の形態における選択ステップ101は、第1の実施の形態における処理と同様に、を子要素にもつ
のみに着目し、その選択を行う。本実施の形態においては、選択する場面すべての継続時間の和にしきい値を設ける。すなわち、それまでに選択された
の継続時間の和が、このしきい値以下で最大となるまで、
のpriorityの大きい順に選択を行う。図33に、本実施の形態における選択ステップ101のフローチャートを示す。を子要素としてもつ
の集合をΩとする(S1)。まず、属性priorityをキーとして、Ωの要素
を降順にソートする(S2)。Ωから最もpriorityの大きい
を選択する(S4、S5)。選択された
をΩから除去する。選択された
の子要素をすべて調べることにより、
の開始時間と終了時間を求め、
の継続時間を計算する(S6)。これまでに選択された
の継続時間の和を求め(S7)、しきい値を越えていれば処理を終了する(S8)。しきい値以下であれば、今回選択された
の開始時間と終了時間とを出力し(S9)、Ωからpriorityの最も大きい
の選択へ返る。この処理を、選択された
の継続時間の和がしきい値を越えるか、あるいはΩが空集合となるまで繰り返す(S4、S8)。
【0055】
なお、本実施の形態では、を子要素として持つ
に着目して処理を行ったが、ほかにに着目して、それらの選択を行っても良い。この場合、priorityは、コンテンツ内すべての間での重要度とする。また、を子要素として持たない
のうち同じ階層のものに着目して、その選択を行っても良い。すなわち、あるいはから数えて同じ経路数の
に着目した処理を行っても良い。
【0056】
また、第2の実施の形態と同様に、
の各々のpriorityを文脈内容における客観的な重要度とし、から祖先である最上位の
までのpriorityの相加平均paを計算して、paの大きい順からを子要素としてもつ
、あるいはを、継続時間の和がしきい値以下の最大となるまで選択する、としても同様の効果が得られる。」

なお、本出願の願書に最初に添付した特許請求の範囲には、「相加平均」に関する記載はない。


(1-a)
以上の記載によれば、〔第2の実施の形態〕及び〔第3の実施の形態〕には、「スコア」の「相加平均」を求める旨の記載はあるものの、「相加平均」を求める対象の「スコア」は、「該当する場面における文脈内容に基づいた客観的な重要度」(段落【0027】)であって、本件補正事項で問題となっている「『場面の内容を表す少なくとも1つのキーワードによって表される観点』に基づいた各セグメントの重要度を表すスコア」とは異なるものである。


(1-b)
しかも、「本実施の形態における選択ステップ101では、から祖先である最上位の
までの経路上すべてのpriorityの相加平均をとり、その値がしきい値以上のを選択する。」(段落【0049】)と記載されているように、
相加平均をとるのは、「から祖先である最上位の
までの経路上すべてのpriority」(すなわち、セグメントに付加されたスコアと、当該セグメントの直上にあるセクションから当該セグメントの祖先である最上位のセクションまでの経路上にある全てのセクションに付加されたスコア)に対してであって、
本件補正事項にあるような、「最上位階層までの経路上のセグメントの前記スコア」(すなわち、「セクション」に付加されたスコアに対しては相加平均をとらない。)に対してではない。


(2)
また、本出願当初明細書等には、「キーワードの観点」に関して、以下の記載(なお、下線は、当審にて付加)がある。

「【0080】
〔第7の実施の形態〕
以下、本発明に係る第7の実施の形態について述べる。本実施の形態においては、メディアコンテンツとして、MPEG1システムストリームの動画像を想定する。この場合、メディアセグメントは、ひとつのシーンカットに相当する。また本実施の形態において、スコアは、該当する場面における、ユーザ等が選択した登場人物や事柄等のキーワードの観点に基づいた重要度とする。
【0081】
図56は、本実施の形態におけるデータ処理方法のブロック図である。図56において、3301は選択ステップを、3302は抽出ステップを表す。選択ステップ3301は、文脈内容記述データのキーワードとそのスコアから、メディアコンテンツの場面を選択し、その場面の開始時間と終了時間を出力する処理を行う。また、抽出ステップ3302は、選択ステップ3301が出力した開始時間と終了時間によって区切られるメディアコンテンツの区間のデータを抽出する処理を行う。
【0082】
図57に、本実施の形態の文脈内容記述データの構成を示す。本実施の形態では、文脈内容を木構造で記述する。また、木構造の兄弟関係は、左から時間順にならんでいるものとする。図57において、と記されている木構造の根(root)は、ひとつのコンテンツを表し、属性としてそのコンテンツのタイトルが付けられる。
【0083】
の子要素は、
である。
には、その場面の内容や登場人物などを表すキーワードであるkeywordと、このキーワードの重要度を表すpriorityとの組(keyword, priority)が属性として付加される。priorityは1から5までの整数値とし、1が最も重要度が低く、5が最も重要度が高い、とする。(keyword, priority)組は、ユーザが見たいと思う場面、人物などを検索する時のキーに用いることができるように設定する。そのため、(keyword, priority)組は、ひとつの
に複数付加することが可能とする。例えば登場人物を記述する場合、その場面に現れる人物の数だけ(keyword,priority)
組を付加し、また、priorityは、該当場面に該当keywordの人物が、数多く登場する場合はその値が高い、といったように設定する。
【0084】
の子要素は、
である。すなわち、
は、それ自身を子要素としても良いとする。ただし、ひとつの
の子要素として、
を混在させてはならないこととする。
【0085】
は、ひとつのシーンカットを表し、
と同様の(keyword, priority)組と、該当シーンの時間情報として、開始時間を表すstartと、終了時間を表すendとが、属性として付加される。シーンカットの方法は、市販されていたり、ネットワークで流通しているソフトを用いても良いし、人手で行っても良い。なお、本実施の形態では、時間情報をシーンカットの開始時間と終了時間としたが、時間情報として開始時間と該当シーンの継続時間としても同様の効果が得られる。この場合、該当シーンの終了時間は、開始時間に継続時間を加算して求められる。
【0086】
・・・(中略)・・・
【0088】
以下、選択ステップ3301での処理について説明する。本実施の形態における選択ステップ3301での処理は、を子要素に持つ
に着目して処理を行う。図81に、本実施の形態における選択ステップ3301の処理のフローチャートを示す。本実施の形態における選択ステップ3301は、場面選択のキーとなるキーワードとそのpriorityのしきい値を入力とし、文脈内容記述データのを子要素としてもつ
から、キーと同じキーワードを持ち、かつ、そのpriorityがしきい値以上の
を選択する(S2、S3)。続いて、選択された
のうち、キーと同じキーワードを持ち、かつ、そのpriorityがしきい値以上ののみを選択する(S5、S6)。以上の処理から選択されたの属性であるstartとendより、選択された場面の開始時間と終了時間を求め、それを出力する(S7、S8、S9、S10、S11、S1、S4)。
【0089】
なお、本実施の形態では、を子要素として持つ
に着目して処理を行ったが、ある階層の
とその子要素である
の親子関係に着目して、同様の処理を行っても良い。また、親子関係も2階層のみではなく、さらに階層を増やして、木構造の葉であるまで同様の処理を行ってもよい。さらに、検索のキーを、複数のキーワードとその間の条件との組としてもよい。キーワード間の条件には、「どちらか」、「ともに」、「どちらか」と「ともに」の組合せと、いったものがある。選択のしきい値も、キーワードが複数の場合はキーワード毎に指定して処理を行っても良い。この検索キーとなるキーワードは、ユーザの入力によって受けとっても良いし、ユーザプロファイルなどからシステムが自動的に設定する構成でも良い。
【0090】
抽出ステップ3302の動作は、第1の実施の形態で述べた抽出ステップと同様のものである。
【0091】
本実施の形態の効果としては、図82に示すように、抽出ステップ3302の出力であるビデオストリームとオーディオストリームをそれぞれビデオ再生手段、オーディオ再生手段に入力させ、ビデオストリームとオーディオストリームを同期させて再生することにより、該当メディアコンテンツの、視聴者個人が見たいシーンのみを再生することができる。また、上記得られたビデオストリームとオーディオストリームを多重化することによって、該当メディアコンテンツの視聴者個人が見たいシーン集のMPEG1システムストリームを作成することができる。」

「【0121】
〔第14の実施の形態〕
以下、本発明に係る第14の実施の形態について述べる。図98は、本実施の形態におけるデータ処理方法の処理を示すブロック図である。同図において、501は選択ステップを、503は抽出ステップを表す。選択ステップ501は、文脈内容記述データのスコアから、メディアコンテンツの少なくともひとつの区間または場面を選択し、その選択された区間または場面を出力するステップである。なお、選択された区間とは、例えば、選択区間の開始時間および終了時間である。また、抽出ステップ503は、選択ステップ501が出力した選択区間によって区切られたメディアコンテンツの区間(以下、メディアセグメントと称す)のデータ、すなわち選択区間のデータのみを抽出する処理を行うステップである。
【0122】
なお、スコアは、文脈内容における客観的な重要性に基づいた重要度でもよいし、ユーザ等が選択した登場人物や事柄等のキーワードの観点に基づいた重要度でもよい。」


以上の記載によれば、〔第7の実施の形態〕及び〔第14の実施の形態〕には、「『場面の内容を表す少なくとも1つのキーワードによって表される観点』に基づいた各セグメントの重要度を表すスコア」を用いる旨の記載はあるものの、当該スコアの「相加平均」を用いることは記載されていない。


また、〔第7の実施の形態〕から派生した形態である〔第8の実施の形態〕乃至〔第11の実施の形態〕、〔第15の実施の形態〕にも、「『場面の内容を表す少なくとも1つのキーワードによって表される観点』に基づいた各セグメントの重要度を表すスコア」の「相加平均」を用いることは記載されていない。


(3)
更に、本出願当初明細書等には、以下の記載がある。

「【0179】
また、スコアをメディアコンテンツの文脈内容に基づいた重要度を示すものとすることによって、このスコアを重要な場面を選択するよう設定しておくことによって、例えば、番組などのハイライトシーン集などの作成を容易に行うことができ、また、スコアを該当する場面におけるキーワードの観点に基づいた重要度を示すものとし、キーワードを決定することによってより自由度の高い区間の選択を行うことができる。例えば、キーワードを登場人物や事柄などの特定の観点によって決定することによって、ユーザが見たい場面だけを選び出すことができる。」

以上の記載によれば、
・「メディアコンテンツの文脈内容に基づいた重要度」を表す「スコア」を採用することによって「番組などのハイライトシーン集などの作成を容易に行う」という編集目的と達成すること、
・「該当する場面におけるキーワードの観点に基づいた重要度」を表す「スコア」を採用することによって「ユーザが見たい場面だけを選び出す」という編集目的を達成すること、
というように、メディアコンテンツの編集目的(例:ハイライトシーン集を作成すること、ユーザが見たい登場人物が登場する場面だけを選び出すこと)に応じてスコアの種類を変更することが開示されている。


(3-a)
そして、編集に用いるスコアの種類が変わる程度にまで編集目的が変われば、適用可能な編集アルゴリズムも変わり得る、
すなわち、ある編集目的で用いられていた編集アルゴリズムの全てを、別の編集目的の編集アルゴリズムとして用いることができるとは限らないことは明らかである。

実際、上記(1)及び(2)で検討したように、本出願当初明細書等には、
(例えば、ハイライトシーン集を作成するために)「該当する場面における文脈内容に基づいた客観的な重要度」を表すスコアに対して「相加平均値」を用いる「実施の形態」は記載されているが、
(例えば、ユーザが見たい登場人物が登場する場面だけを選び出すために)「該当する場面における、ユーザ等が選択した登場人物や事柄等のキーワードの観点に基づいた重要度」を表すスコアに対して相加平均値を用いる「実施の形態」は記載されていない。

つまり、本出願当初明細書等に、「該当する場面における文脈内容に基づいた客観的な重要度」を表すスコアに対して相加平均値を用いることが記載されているからといって、「該当する場面における、ユーザ等が選択した登場人物や事柄等のキーワードの観点に基づいた重要度」を表すスコアに対しても相加平均値を用いることが、『示唆』されているとはいえない。


(3-b)
また、本出願当初明細書等には、

・「該当する場面における文脈内容に基づいた客観的な重要度」を表すスコアを用いること、及びそれに対して「相加平均値」を用いることは「第2の実施の形態」に開示される一方、
「該当する場面における、ユーザ等が選択した登場人物や事柄等のキーワードの観点に基づいた重要度」を表すスコアを用いることは「第7の実施の形態」及び当該形態から派生した形態に開示されているように、
独立した実施の形態として記載されていること、

・「最上位階層までの経路上のセグメントの前記スコアの相加平均値を用いる」ことの技術的意義について明記されていないこと、

の2点から、本出願当初明細書等には、「第2の実施の形態」に開示された技術を、「第7の実施の形態」等に適用することの『示唆』(又は『動機付け』)、
すなわち、「該当する場面における文脈内容に基づいた客観的な重要度」を表すスコアに対してだけでなく、「該当する場面における、ユーザ等が選択した登場人物や事柄等のキーワードの観点に基づいた重要度」を表すスコアに対しても「相加平均値」を用いることの『示唆』(又は『動機付け』)を見出すことが出来ない。

一方、平成20年(行ケ)第10096号(http://www.courts.go.jp/hanrei/pdf/20090129104737.pdf)において、
「2 判断
(1) 特許法29条2項が定める要件の充足性,すなわち,当業者が,先行技術に基づいて出願に係る発明を容易に想到することができたか否かは,先行技術から出発して,出願に係る発明の先行技術に対する特徴点(先行技術と相違する構成)に到達することが容易であったか否かを基準として判断される。ところで,出願に係る発明の特徴点(先行技術と相違する構成)は,当該発明が目的とした課題を解決するためのものであるから,容易想到性の有無を客観的に判断するためには,当該発明の特徴点を的確に把握すること,すなわち,当該発明が目的とする課題を的確に把握することが必要不可欠である。そして,容易想到性の判断の過程においては,事後分析的かつ非論理的思考は排除されなければならないが,そのためには,当該発明が目的とする「課題」の把握に当たって,その中に無意識的に「解決手段」ないし「解決結果」の要素が入り込むことがないよう留意することが必要となる。さらに,当該発明が容易想到であると判断するためには,先行技術の内容の検討に当たっても,当該発明の特徴点に到達できる試みをしたであろうという推測が成り立つのみでは十分ではなく,当該発明の特徴点に到達するためにしたはずであるという示唆等が存在することが必要であるというべきであるのは当然である。」(下線は当審にて付加。)
と判示(なお、当該判示を引用する判決として、平成20年(行ケ)第10153号、平成20年(行ケ)第10261号がある。)されているように、「発明の特徴点に到達するためにしたはずであるという『示唆等』が存在」しないものは「当該発明が『容易想到』であると判断」されない。

そうすると、上述したように、「第2の実施の形態」に開示された技術を、「第7の実施の形態」等に適用することの『示唆』(又は『動機付け』)がないのであるから、
「第2の実施の形態」に開示された技術を、「第7の実施の形態」等に適用することは『容易想到』ではない(当然に、『自明』ではない。)、
すなわち、「該当する場面における文脈内容に基づいた客観的な重要度」を表すスコアに対してだけでなく、「該当する場面における、ユーザ等が選択した登場人物や事柄等のキーワードの観点に基づいた重要度」を表すスコアに対しても相加平均値を用いることは、『自明』でない。



(4)
上記(1-b)及び(3-b)で得られた結論から、本件補正事項は、本出願当初明細書等のすべての記載を総合することにより導かれる技術的事項との関係において、新たな技術的事項を導入するものである。



3.むすび

以上のことから、本件補正事項を含む本件補正は、特許法第17条の2第3項の規定に違反するので、同法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。




第3 本願発明について

1.本願発明

平成21年5月15日付けの手続補正は上記のとおり却下されたので、本願の請求項1乃至11に係る発明は、平成21年2月13日付けの手続補正書の特許請求の範囲の請求項1乃至11に記載されたとおりのものと認められるところ、その請求項1に係る発明(以下、「本願発明」という。)は、次のとおりのものである。

「 【請求項1】
複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部と、
前記複数のセグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されている属性部と、
の両方を有し、前記メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データを入力する入力部と、
前記属性部に記述されている前記観点及び前記スコアの少なくとも一つ、または、前記観点及び前記スコアの少なくとも一つと前記時間情報との組み合わせに基づいて、前記データ構造部からセグメントを選択する選択部と、
を備えるデータ処理装置。」



2.引用例

原査定の拒絶の理由に引用文献1として引用された、特開平8-255171号公報(以下、「引用例」という)には、図面と共に以下の技術事項が記載されている。

(ア)
「 【0001】
【産業上の利用分野】
本発明は、例えば映像、音声、文書等の情報を統合的に表示、記録、再生、編集するマルチメディア情報処理装置に関する。」

(イ)
「 【0002】
【従来の技術】
パーソナルコンピュータ(PC)などに搭載されるマイクロプロセッサの性能向上はめざましく、普及型のPCで大量の情報を高速に処理できる環境が整いつつあることは周知である。また、近年の光通信技術や通信制御技術、及び光磁気ディスクや高密度集積回路によるメモリ素子等の発展により前者において情報伝送路が大容量化し、後者において情報蓄積装置が大容量化していることも作用して、家庭やオフィスでも安価な装置で大量の情報を電子的に入手することができるといったことが実現しつつある。」

(ウ)
「 【0005】
これらの情報の分類、又は複数の情報の中から特徴となる部分を抽出する作業を自動化しようとする開発は、現在も盛んに行われている。しかし、それらの中の多くは人間の判断機構を代替することを目標としており、高度な人工知能を必要とし、開発の時間の面からも、また費用の面からも、現時点ではコストがかかりすぎるといわざるを得ない。また、そのような自動分類システムには、ユーザは自分が望むものを指示してやる必要があり、何が見たい、どのような情報を得たい、といったビジョンのはっきりしないユーザには扱いづらい。このような不案内なユーザは、情報があふれる時代にこそ激増するものと想定できる。
【0006】
むしろ必要とされるのは、「おもしろい(=interesting )と感じる場所がここである」と示す情報であり、必ずしもその内容を記述することを必要としているわけではない。たとえば映画の中で1場面だけ魅力的な俳優が出演していたとき、その俳優が誰なのか、男なのか女なのか、さらにそのオブジェクト(被写体)が人間なのか、という情報は常に必要ではなく、ただその場面を指し示してくれる装置であれば十分要件は満たされる場合が多い。にも関わらず、現在の情報分類の流れでは、「情報を装置が精査する→特徴となる部分を候補として抽出する→ユーザが入力した要求情報と照合する→分類・提示を行う」という手順であるため、いったん情報内容の解析を入念に行わなくてはならなくなる。」

(エ)
「 【0009】
【本発明が解決する課題】
以上詳述したように、従来の情報処理装置では、多種多様の情報を、情報の種類を越えて効率よく、かつ利用者の意図を反映して分類・整理などを行う手段がなかった。このために、利用者は、その情報の処理作業に時間と労力を割かなければならず、これを装置として自動で行う場合にも、必ずしも個々の利用者に適応して処理できないという欠点があった。また従来は情報の加工方法も繁雑で、その実現のためには高コストとなりやすいという欠点もあった。
【0010】
本発明は、上記実情に鑑みなされたものであり、多種多量の情報から簡便な操作で効率よく利用者が必要とする情報を加工、提示することのできる情報処理装置を提供することを目的とする。」

(オ)
「 【0022】
【実施例】
以下、図面を参照して本発明の実施例を説明する。
【0023】
(第1実施例)
図1は第1実施例に係る情報処理装置の構成を示すブロック図である。
【0024】
同実施例では、利用者の「重要である/ない」についての評価値を入力する方法として、利用者の視線を検出し、その視点の移動の様子から上記評価値(以下、重要度レベルという)を自動判定する場合について説明する。なお、視点の移動から重要度レベルを算出する方法については第3実施例において詳述する。
【0025】
記録媒体107から読み出し制御部105を介して読み取られた情報は、提示部106に表示されるが、そのときの利用者の視点は検出器101によって位置検出される。判定部102内では上記視点情報が一定時間分記録されて処理される。この処理は、例えば5秒分の利用者の視点を1/30秒ごとに検出し、150個データが集まるごとに重要度推定計算を行うなどというように行われる。判定部102では、送られてきた視点データから、その記録時間内での重要度レベルを算出する。この例では、5秒ごとに、前5秒の重要度レベルが出力されるというように行われる。ここで、重要度レベル算出は、記録間隔と同じ周期で行われる場合に限らない。例えば、今回送られてきた5秒分のデータのうち過去側2.5秒の視点データと、前回送られてきた5秒分のデータのうち現在側2.5秒のデータとを併せて重要度レベル算出を行う、という過程を間に入れることによって、2.5秒間隔で重要度レベル出力が可能になる。当然、同様の方法で出力間隔をさらに短くすることも可能である。
【0026】
判定部102より一定の出力間隔で送られる重要度レベルは、提示情報全体にわたって重要度情報一時記憶部110に記憶され、記録媒体107に記録される。ここでいう提示情報全体とは、1番組分、映画1本分、写真アルバムの1旅行分等のストーリーの1まとまりに対応する区間等で、通常これらは従来の方法で既に区切りがはっきりしている(VTRのインデックス信号、映画ソフトの1巻、アルバムの見出し、あるいはコンピュータデータの1ファイル等)。記録媒体107は、提示情報が記録されていたものと同一の媒体でも異なる媒体でも構わない。例えば、光磁気ディスクから読み出して提示した画像情報に関する重要度レベル情報は、もとの光磁気ディスクに保存してもよいし、重要度レベル保存用のメモリICを用いてもよい。あるいは通信ネットワークで結ばれた遠隔の記録装置から読み出して提示した情報(たとえばビデオ・オン・デマンド等)に関する重要度レベル情報を、ネットワークを介して元の記録装置に戻して記録してもよいし、利用者が端末として利用しているコンピュータ側で記録しておいてもよい。この例では、提示情報全体にわたって重要度情報を重要度情報一時記憶部110に一時記憶する場合を述べたが、情報提示中でも判定部102が、逐次、重要度判定を行い、記録媒体107において原情報提示と重要度情報記録が同時に行えるような条件下では、情報提示と並行して重要度情報を記録媒体107に記録してもよい。」

(カ)
「 【0049】
最後に、以上のようにして入力・補正された重要度レベルを用いて、自動的にもとの情報を加工・提示する方法について説明する。
【0050】
この場合、図1においては原情報と重要度レベル情報との両者が記録媒体107から読み出し制御部105を介して読み出され、それぞれ原情報一時記憶部113、重要度情報一時記憶部110に蓄積されるが、重要度情報一時記憶部110の重要度レベル情報に基づいて原情報のうちの提示すべき部分が提示部分選択部111によって選択される。これについては後で詳しく述べる。アドレス生成部112では、選択された部分に関する情報を提示部分選択部111より受け、記録媒体107上で提示すべき情報が記録されている場所をアドレスとして出力する。読み出し制御部105では、このアドレス情報に基づいて選択的に記録媒体107にアクセスし、原情報の部分を原情報一時記憶部113に送る。以降の過程はすでに説明した画面表示方法と同じである。」

(キ)
「 【0051】
ここでもちろん、アドレス生成部112では記録媒体からの読み出し場所を制御する代わりに、原情報一時記憶部113からの読み出し場所を制御してもよい。この場合、一般的に読み出しスピードの向上を望むことができる(現状では一般に記録媒体107に用いられる光磁気ディスクなどのアクセススピードよりも、原情報一時記憶部113に用いられる半導体メモリ素子の方が早い)。以下では提示部分選択部111で原情報の部分選択を行う過程を具体的に説明する。
【0052】
ここで説明する加工・提示の方法は、情報の意味的区切り(動画像のシーンチェンジ、音声・文書の文章単位や段落単位、音楽のフレーズ=4?16小節程度で構成される展開のパターン)を、既存の画像認識、音声認識など別の方法で検出し、その区切りを利用する場合と、しない場合の2通りがある。」

(ク)
「 【0053】
まず、区切りを利用しない場合について図6を用いて説明する。
【0054】
利用者は、情報加工の結果として生成される提示情報に希望する時間的長さを入力する。これはボリュームつまみのようなものによってもよいし、キーボードを用いて直接「何分何秒」と入力してもよい。即ち、時間長を入力する方法であれば、一般に用いられているいかなる方法でも構わない。本装置では、しきい値601を、規定の重要度レベル最大値Imax 602より徐々に下げてゆき、重要度レベルの時間推移603の中で、しきい値601を越える時間区間604の合計を計算する。この計算結果が入力された提示希望時間を越えるまで、しきい値601を下げる過程を続ける。このようにして提示希望時間を越える直前のしきい値601が決定したとき、本装置はしきい値601を越える時間区間604だけを順次提示する。あるいは、重要度レベルのしきい値以上の極大値605の瞬間の情報を画面に列挙しておき、その画面をマウスまたは注視などで選択したときには、この極大値を含んでしきい値を越える時間区間を提示するという方法もある。これによって、利用者は情報の全時間のうち、特に重要度の高い部分だけを選択的に見ることができる。」

(ケ)
「 【0055】
次に、情報の意味的区切りが既知で、それを利用する場合について図7を用いて説明する。
【0056】
まず情報が動画像である場合について説明する。
【0057】
動画像に対応して重要度レベル701が付与されており、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。1つのカット703内では、重要度レベルはそのカット703での最大の値704に一致させる。こうすることによって、上記の情報の区切りを利用しない場合と同じ方法が利用できる。
【0058】
即ち、しきい値705を徐々に下げ、しきい値705を越える時間区間の合計が設定された提示希望時間を越える直前のしきい値705を求める。このとき、しきい値705を越える時間区間、即ちカットを順次提示することによって、カット単位で要約を作成することができる。
【0059】
また、カット703内の重要度レベルを、そのカットでの最大の極大値を用いるかわりに、カット703内の重要度レベルの積分値をカット703の長さで割った「重要度レベル密度」706に一致させて、上記と同様のカット選択を行うこともできる。
【0060】
この2つの選択方法が持つ意味の違いは、前者(カット703内の重要度レベルは最大の極大値704)が、瞬間的な最大の印象の強さでカット703を評価するのに対して、後者(カット703内の重要度レベルはカット703内での平均値706)は、カット703全体が与えた印象の強さで評価していることである。」

(コ)
「 【0061】
以上の中で「順次提示」を行う際のアドレス生成部112の動作の例を図8を用いて説明する。
【0062】
図8中の折れ線グラフのうち、右にあるもの((b))は図6のグラフを90度回転したものである。図6を用いて説明した方法で選択された部分がハッチングして示してある。この様な場合、選択された部分を順次提示する時には、アドレス生成部112は、図8の左((a))に示すようなアドレスを出力する(ただしこれは記録媒体107上に原情報の時間経過と線形に記録がなされた場合である。時間経過と因果関係のない配置で原情報が記録されている場合、図8左のグラフの縦軸はアドレスの代わりに提示すべき時刻位置を示す)。即ち、要約提示の際、選択された時間区間では正常な動作速度で再生され、そうでない場所はスキップされる。選択された部分が上述のようにカット単位の場合でも動作は同じである。
【0063】
上記のようにして選択されたカットは、選ばれたカットを時間的に前にあるものから順次提示する方法の他に、カットの重要度レベルが高いものから順に提示する方法がある。その他にも、選択されたカットの先頭画面だけを小画面として画面に列挙し、利用者がその小画面をマウスや視線などで選択すると、そのカットの動画像が提示されるという方法もある。ここで、カットを代表させる画面はカットの先頭画面である必要はなく、そのカット中で最も高い重要度レベルを示した瞬間の画面を表示してもよい。あるいは、上で述べてきたような方法で提示すべき場所だけを選定しておき、それぞれの区間の提示時間の早さや方向、順序などは利用者の操作によって自由に変化させられるようになっていてもよい。このようにすると、例えば10秒ずつ30枚提示される静止画が原情報であるような場合、特に重要な画像10枚だけを重要度レベルのしきい値をもちいて選択しておき、その10枚中の1枚1枚は好きな時間だけ見る、といったことが可能になる。」

(サ)
「 【0066】
(第2実施例)
次に第2実施例として、本発明の情報処理装置においてユーザが行う処理、及び提示部での表示について図を用いてより詳細に説明する。
【0067】
同実施例では入力のためのポインティングデバイスにマウスを使用することを仮定しているが、本発明に係る情報処理装置においては、いかなるポインティングデバイスでも使用可能である。
【0068】
まず、ユーザが重要度レベルを利用して動画像の提示を行う場合のユーザの操作、及び提示部での表示について説明する。
【0069】
ユーザが動画像を提示させるときには、提示部にはたとえば図10又は図11のような表示を行う。図10は表示させる動画像を大きく表示させており、一方図11では動画像に付与された重要度レベルを同一画面内で明示している。これらの表示方法は、用途によってユーザが選べるようにしておく。ここで、1000は重要度レベルを利用して動画の表示を行うときに重要度レベルのしきい値を調節するためのレバーで、レバーを上に上げれば動画像の重要度レベルの高い部分のみが提示されるようになり、逆に下に下げれば重要度レベルの低い部分までも提示されるようになる。これは、第1実施例で図6や図7を用いて説明したのと同様である。
【0070】
1001は、提示時間表示窓であり、レバー1000によって重要度レベルのしきい値が設定されたときに、一つの動画の中でしきい値を上回る重要度レベルが付与された部分の合計がどの程度の時間になるかを表示するものである。この図の例では12分41秒となっている。ユーザは動画の大まかな内容をある時間内で見てしまいたいときには、窓1001の中の時間を見ながらレバー1000を調整すればよい。もちろん、第1実施例で説明したように、直接窓1001の中に時間を打ち込むことにより、重要度レベルのしきい値を設定することも可能である。この際には、窓1001にマウスカーソルをあわせてクリックし、次にキーボード等の入力装置から時間を入力する。希望の時間に設定ができたら、1008の操作ボタンのうち、「はじめから再生する」ボタンを押すことにより、動画の中の重要度レベルの高い部分だけを希望の時間内で見ることができる。この際には、第1実施例で説明した情報の意味的区切りを利用する場合、及び利用しない場合のどちらでも場合においても同様の手続きによって動画の提示を行うことができる。」

(シ)
「 【0074】
ここまで重要度レベルは動画一つにつき一種類しか付与されていないことを前提に説明してきたが、重要度レベルは複数付与することも可能である。例えば、一つの動画や音声、静止画群に対しても利用者ごとに重要度レベルを用意することもできるし、また、目的別によっていくつかの重要度レベルを付与することも可能である。具体的には、例えば動画がドラマであったときに、アクションシーンを見るといった目的や、泣かせるシーンを見たいといった目的でそれぞれ別の重要度レベルを付与することができる。」

(ス)
「 【0075】
1005は、重要度レベル選択ボタンで、それぞれのボタンに用意されている重要度レベルの名前が表示されている。例えば、利用者の名前であったり、アクションシーン、泣かせるシーンといった目的別の名前などが表示されている。他の重要度レベルを使って動画の提示を行うためには、ボタン1005を選択し直せばよい。窓1003の中では他の重要度レベルを選択すると、それに応じて指定されたボタンに対応する重要度レベルを表示するよう変更される。」

(セ)
「 【0115】
【発明の効果】
以上詳述したように、本発明に係る情報処理装置によれば、マルチメディア情報に例えば重要度レベルという付加情報を付与、修正することが可能になり、その重要度レベルを用いた情報の特徴抽出が、利用者の意図を反映した形式で、かつ高度な知識処理を必要とせず実現することができる。
【0116】
このように、情報の特徴抽出が容易になることで、利用者が情報にアクセスする時間の短縮が可能になり、ネットワークへの負担軽減に寄与するとともに利用者に専門的な知識を強要することのない使いやすい情報アクセスのインタフェースを提供できる。」


以上の引用例の記載によれば、引用例には以下の事項が開示されていると認められる。

(a)
一般的に、「カット」が「映画の構成単位。一つの連続した場面。また、それが写っているフィルム。」(「株式会社岩波書店 広辞苑第五版」より抜粋)を意味し、「シーン」が「映画・演劇などの一場面。」(株式会社岩波書店 広辞苑第五版」より抜粋)を意味すること、すなわち、「カット」や「シーン」は『場面』に対する用語であることは世間常識であること、

引用例の上記(ケ)の「次に、情報の意味的区切りが既知で、それを利用する場合について図7を用いて説明する。・・・(中略)・・・動画像に対応して重要度レベル701が付与されており、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。1つのカット703内では、重要度レベルはそのカット703での最大の値704に一致させる。こうすることによって、上記の情報の区切りを利用しない場合と同じ方法が利用できる。」という記載、
(なお、「・・・、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。」という記載から、「動画像の意味的区切りであるシーンチェンジ」が、場面の「意味区切り」である「シーンチェンジ」という時間情報を表していることは明らかである。)

引用例の上記(シ)の「ここまで重要度レベルは動画一つにつき一種類しか付与されていないことを前提に説明してきたが、重要度レベルは複数付与することも可能である。例えば、一つの動画や音声、静止画群に対しても利用者ごとに重要度レベルを用意することもできるし、また、目的別によっていくつかの重要度レベルを付与することも可能である。具体的には、例えば動画がドラマであったときに、アクションシーンを見るといった目的や、泣かせるシーンを見たいといった目的でそれぞれ別の重要度レベルを付与することができる。」という記載、
(なお、「・・・、重要度レベルは複数付与することも可能である。・・・(中略)・・・、また、目的別によっていくつかの重要度レベルを付与することも可能である。」という記載から、目的別に重要度レベルが少なくとも1つ付与されていること、すなわち、目的と目的別の重要度レベルの組が少なくとも1つあることは明らかである。)

引用例の上記(ス)の「1005は、重要度レベル選択ボタンで、それぞれのボタンに用意されている重要度レベルの名前が表示されている。例えば、利用者の名前であったり、アクションシーン、泣かせるシーンといった目的別の名前などが表示されている。他の重要度レベルを使って動画の提示を行うためには、ボタン1005を選択し直せばよい。窓1003の中では他の重要度レベルを選択すると、それに応じて指定されたボタンに対応する重要度レベルを表示するよう変更される。」という記載から、

引用例には、
「複数の場面で構成される動画像の各場面を表す複数のカットと、
前記複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータと、
の両方」
が開示されていると認められる。


(b)
上記(a)の
「複数の場面で構成される動画像の各場面を表す複数のカットと、
前記複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータと、
の両方」
を有するという開示、

引用例の上記(カ)の「最後に、以上のようにして入力・補正された重要度レベルを用いて、自動的にもとの情報を加工・提示する方法について説明する。・・・(中略)・・・この場合、図1においては原情報と重要度レベル情報との両者が記録媒体107から読み出し制御部105を介して読み出され、それぞれ原情報一時記憶部113、重要度情報一時記憶部110に蓄積されるが、重要度情報一時記憶部110の重要度レベル情報に基づいて原情報のうちの提示すべき部分が提示部分選択部111によって選択される。これについては後で詳しく述べる。」という記載、

引用例の上記(キ)の「以下では提示部分選択部111で原情報の部分選択を行う過程を具体的に説明する。・・・(中略)・・・ここで説明する加工・提示の方法は、情報の意味的区切り(動画像のシーンチェンジ、音声・文書の文章単位や段落単位、音楽のフレーズ=4?16小節程度で構成される展開のパターン)を、既存の画像認識、音声認識など別の方法で検出し、その区切りを利用する場合と、しない場合の2通りがある。」という記載、

引用例の上記(ク)の「まず、区切りを利用しない場合について図6を用いて説明する。・・・(中略)・・・利用者は、情報加工の結果として生成される提示情報に希望する時間的長さを入力する。・・・(中略)・・・本装置では、しきい値601を、規定の重要度レベル最大値Imax 602より徐々に下げてゆき、重要度レベルの時間推移603の中で、しきい値601を越える時間区間604の合計を計算する。この計算結果が入力された提示希望時間を越えるまで、しきい値601を下げる過程を続ける。このようにして提示希望時間を越える直前のしきい値601が決定したとき、本装置はしきい値601を越える時間区間604だけを順次提示する。」という記載、
(当該記載から、情報の意味的区切りを利用しない場合、時間区間に基づいて所望の動画像を選択していることは明らかである。)

引用例の上記(ケ)の「次に、情報の意味的区切りが既知で、それを利用する場合について図7を用いて説明する。・・・(中略)・・・動画像に対応して重要度レベル701が付与されており、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。1つのカット703内では、重要度レベルはそのカット703での最大の値704に一致させる。こうすることによって、上記の情報の区切りを利用しない場合と同じ方法が利用できる。・・・(中略)・・・このとき、しきい値705を越える時間区間、即ちカットを順次提示することによって、カット単位で要約を作成することができる。」という記載、
(当該記載及び情報の意味的区切りを利用しない場合の記載から、情報の意味的区切りを利用する場合、シーンチェンジによって決定される時間区間という時間情報に基づいてカットを選択していることは明らかである。)

引用例の上記(サ)の「次に第2実施例として、本発明の情報処理装置においてユーザが行う処理、及び提示部での表示について図を用いてより詳細に説明する。・・・(中略)・・・ユーザが動画像を提示させるときには、提示部にはたとえば図10又は図11のような表示を行う。図10は表示させる動画像を大きく表示させており、一方図11では動画像に付与された重要度レベルを同一画面内で明示している。これらの表示方法は、用途によってユーザが選べるようにしておく。ここで、1000は重要度レベルを利用して動画の表示を行うときに重要度レベルのしきい値を調節するためのレバーで、レバーを上に上げれば動画像の重要度レベルの高い部分のみが提示されるようになり、逆に下に下げれば重要度レベルの低い部分までも提示されるようになる。これは、第1実施例で図6や図7を用いて説明したのと同様である。・・・(中略)・・・1001は、提示時間表示窓であり、レバー1000によって重要度レベルのしきい値が設定されたときに、一つの動画の中でしきい値を上回る重要度レベルが付与された部分の合計がどの程度の時間になるかを表示するものである。この図の例では12分41秒となっている。ユーザは動画の大まかな内容をある時間内で見てしまいたいときには、窓1001の中の時間を見ながらレバー1000を調整すればよい。もちろん、第1実施例で説明したように、直接窓1001の中に時間を打ち込むことにより、重要度レベルのしきい値を設定することも可能である。この際には、窓1001にマウスカーソルをあわせてクリックし、次にキーボード等の入力装置から時間を入力する。希望の時間に設定ができたら、1008の操作ボタンのうち、「はじめから再生する」ボタンを押すことにより、動画の中の重要度レベルの高い部分だけを希望の時間内で見ることができる。この際には、第1実施例で説明した情報の意味的区切りを利用する場合、及び利用しない場合のどちらでも場合においても同様の手続きによって動画の提示を行うことができる。」という記載から、
(当該記載から、第1実施例で説明した情報の意味的区切りを利用する場合、重要度レベルに基づいてカットを選択していることは明らかである。)

引用例には、「前記目的別に各カットの重要度を表す重要度レベルに基づいて、カットを選択する提示部分選択部」が開示されていると認められる。


(a’)
上記(a)の
「複数の場面で構成される動画像の各場面を表す複数のカットと、
前記複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータと、
の両方」
を有するという開示、

上記(b)の「前記目的別に各カットの重要度を表す重要度レベルに基づいて、カットを選択する提示部分選択部」という開示、

引用例の上記(カ)の「最後に、以上のようにして入力・補正された重要度レベルを用いて、自動的にもとの情報を加工・提示する方法について説明する。・・・(中略)・・・この場合、図1においては原情報と重要度レベル情報との両者が記録媒体107から読み出し制御部105を介して読み出され、それぞれ原情報一時記憶部113、重要度情報一時記憶部110に蓄積されるが、重要度情報一時記憶部110の重要度レベル情報に基づいて原情報のうちの提示すべき部分が提示部分選択部111によって選択される。これについては後で詳しく述べる。」という記載から、
(上記(a)のデータに相当する「原情報と重要度レベル情報との両者」が「提示部分選択部」に入力されていることは明らかであるから、上記(a)のデータに相当する「原情報と重要度レベル情報との両者」を「提示部分選択部」に入力するための構成(例:入力部)が存在することは明らかである。)

引用例には、
「複数の場面で構成される動画像の各場面を表す複数のカットと、
前記複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータと、
の両方を入力する入力部」
が開示されていると認められる。


(c)
引用例の上記(エ)の「本発明は、上記実情に鑑みなされたものであり、多種多量の情報から簡便な操作で効率よく利用者が必要とする情報を加工、提示することのできる情報処理装置を提供することを目的とする。」という記載、

引用例の上記(ケ)の「即ち、しきい値705を徐々に下げ、しきい値705を越える時間区間の合計が設定された提示希望時間を越える直前のしきい値705を求める。このとき、しきい値705を越える時間区間、即ちカットを順次提示することによって、カット単位で要約を作成することができる。」という記載から、

引用例には、「カット単位で要約を作成することができる情報処理装置」が開示されていると認められる。


以上の引用例の記載によれば、引用例には下記の発明(以下、「引用例発明」という。)が開示されていると認められる。

「複数の場面で構成される動画像の各場面を表す複数のカットと、
前記複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータと、
の両方を入力する入力部と、
前記目的別に各カットの重要度を表す重要度レベル又は前記シーンチェンジに基づいて、カットを選択する提示部分選択部と、
を備える、カット単位で要約を作成することができる情報処理装置。」



3.周知例

上田博唯(外3名),動画像解析に基づくビデオ構造の視覚化とその応用,電子情報通信学会論文誌,社団法人電子情報通信学会,1993年08月25日,Vol.J76-D-II,No.8,p.1572-p.1580(以下、「周知例」という)には、図面と共に以下の技術事項が記載されている。

(ア)
「あらまし ビデオ情報の構造に自動記述を行うための機能を開発し,これらの機能によって得られるビデオの時間空間構造をビジュアライゼーションする新しい手法を開発した.機能は,カット分割,カメラと被写体の動き,被写体の軌跡や輪郭線,特定の被写体の存在の判定およびその存在期間の記述等を提供する.更に,被写体の存在判定結果を用いて,同じ被写体はビデオ全体を通じて自動的にリンクされる.このようにして得られるリンクをオブジェクトリンクと名付ける.オブジェクトリンクによるナビゲーションと画像解析結果によってサポートされるビジュアライゼーション手法は,ユーザが生のビデオデータのみならず,ビデオ情報の構造,そしてこれに付加された記述内容を,ダイレクトマニピュレーション(直接操作)によって自由に編集することを可能とした.」
(第1572頁の「あらまし」の欄)

(イ)
「2. 基本構想
図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.シンボリックな記述は,人や物や場所の名前,そしてそれらの行動や関係などの言語的あるいは意味的な情報からなる.視覚的な記述は,対象物の形状や位置,対象物の運動軌跡,対象物が画面に入った時刻と出た時刻,複数の対象物が出会った時刻というような幾何学的あるいは時間的な情報からなる.本研究ではこれらの記述情報をできる限りシステムが自動抽出し,更にそれらの間をハイパリンクで結び付けることによって,ユーザに自由で柔軟な編集環境を提供することを目指している.」
(第1573頁左欄第18行から同頁右欄第3行)

(ウ)
「3. ビデオ解析機能
3.1 カット分割機能
従来のビデオ編集では長い映像を,一まとまりごとのカットに分割する作業に多大な時間を費やしていた.映像編集をシステムがサポートするためにはカットの自動分割が不可欠である.カットの自動分割方式として種々の提案があるが(10),筆者らはフレームを8×6の小領域に分割し,次フレームとの間で,その領域ごとの類似度を求め,これがしきい値を超える領域の数をフレーム間相関値と定義している.そして,このフレーム間相関値の時間差分がしきい値を超えたときにカットの変化点であると判定する(11).カットが分割されると,それぞれに縮小画像アイコン(マイコン)を作成し,ビデオ機器から供給されるイン点とアウト点のタイムコードと共に記憶する(後述の図2参照).」
(第1573頁右欄第30行から第1574頁左欄第1行)

(エ)
「4. 視覚化(Visualization)
4.1 ビデオ情報の記述
視覚化を有効にするためには,ビデオの階層構造を適切に記述することが重要である.MITのDavenportのグループは,ユーザが意味的情報(カメラ位置,照明,アクションおよび解説等の構造)を,構造的な変数としてビデオに付加するシステムを開発している(7).このシステムではユーザが付加するアノテーションをstrata(断層構造)として表現することを試みている.すなわち,異なる視点で付けられたアノテーションがフラットに層を成して積み重ねられる構造である.
これに対し筆者らのシステムでは,ユーザが付加したアノテーションのみならず,ビデオの解析機能から自動的に供給される記述の視覚化を重視している.筆者らの記述の基本は,自動カット分割と対象物の存在判定の結果であり,分割されたカットごとの各種構造情報が,まず図2に示すような記述として格納される.イン点,アウト点のタイムコードとマイコン画像もここに格納されるが,運動解析機能で得られるカメラや対象物(被写体)の運動データはmotionポインタで指示される領域に格納される.そして対象物抽出機能によって得られる対象物の存在期間は,extractionポインタで指される領域に格納される.フレームごとに得られた輪郭線(これから運動軌跡もわかる)データは,更にその先のe-counterポインタが指す領域に格納される.annotationポインタが指す領域には,ユーザがキーボード等から入力するそのカットへの注釈が格納される.
一方,対象物存在判定機能によって得られる情報は,図3に示す形式で格納される.対象物存在判定を行うたびにこのリストは右の方に延びていく.判定は通常複数のカットに対してなされるので,そのカットごとに得られた判定結果が,カットポインタの先のリストとして並ぶ.カット番号を格納しておくことにより,図2の記述情報との対応をとる.ここからオブジェクトポインタで指される先に対象物存在判定機能で得られた存在期間と大まかな形状・位置情報が格納される.対象物が出入りするために,一つのカット内で複数回見つかることがあるのでリスト形式としている.また,対象物抽出機能が,この対象物に対して起動された場合には,それと対応をとるために,extract番号をここに格納しておく.」
(第1574頁右欄第35行から第1575頁右欄第6行)


以上の周知例の記載によれば、周知例には以下の事項が開示されていると認められる。

(a)
一般的に、「カット」が「映画の構成単位。一つの連続した場面。また、それが写っているフィルム。」(「株式会社岩波書店 広辞苑第五版」より抜粋)を意味すること、すなわち、「カット」は『場面』に対する用語であることは世間常識であること、

周知例の上記(イ)の「図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.」という記載から、

周知例には、「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」が開示されていると認められる。


(b)
上記(a)の「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」という開示、

周知例の上記(イ)の「図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.シンボリックな記述は,人や物や場所の名前,そしてそれらの行動や関係などの言語的あるいは意味的な情報からなる.視覚的な記述は,対象物の形状や位置,対象物の運動軌跡,対象物が画面に入った時刻と出た時刻,複数の対象物が出会った時刻というような幾何学的あるいは時間的な情報からなる.本研究ではこれらの記述情報をできる限りシステムが自動抽出し,更にそれらの間をハイパリンクで結び付けることによって,ユーザに自由で柔軟な編集環境を提供することを目指している.」という記載、

周知例の上記(ア)の「オブジェクトリンクによるナビゲーションと画像解析結果によってサポートされるビジュアライゼーション手法は,ユーザが生のビデオデータのみならず,ビデオ情報の構造,そしてこれに付加された記述内容を,ダイレクトマニピュレーション(直接操作)によって自由に編集することを可能とした.」という記載から、
(なお、「ビデオ情報の構造,そしてこれに付加された記述内容」という記載から、記述内容がカットの各々に割り当てられていることは明らかである。)

周知例には、「前記カットの各々に割り当てられる記述内容である記述情報」が開示されていると認められる。


(c)
上記(a)の「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」という開示、

上記(b)の「前記カットの各々に割り当てられる記述内容である記述情報」という開示、

周知例の上記(イ)の「図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.」という記載から、

周知例には、「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造と、前記カットの各々に割り当てられる記述内容である記述情報との両方を有するビデオ情報の階層構造」が開示されていると認められる。


すなわち、周知例には下記の発明(以下、「周知例発明」という。)が開示されていると認められる。

「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造と、前記カットの各々に割り当てられる記述内容である記述情報との両方を有するビデオ情報の階層構造」



4.対比

本願発明と引用例発明とを対比すると、

(1)
引用例発明の、
「カット」、
「場面の意味的区切りを表すシーンチェンジ」は、それぞれ、

本願発明の、
「セグメント」、
「場面の区切りを表す時間情報」に相当することは、

本出願明細書の
「【0085】
は、ひとつのシーンカットを表し、
と同様の(keyword, priority)組と、該当シーンの時間情報として、開始時間を表すstartと、終了時間を表すendとが、属性として付加される。シーンカットの方法は、市販されていたり、ネットワークで流通しているソフトを用いても良いし、人手で行っても良い。なお、本実施の形態では、時間情報をシーンカットの開始時間と終了時間としたが、時間情報として開始時間と該当シーンの継続時間としても同様の効果が得られる。この場合、該当シーンの終了時間は、開始時間に継続時間を加算して求められる」
という記載から明らかである。


(2)
引用例発明の、
「動画像」、
「目的」、
「重要度レベル」は、それぞれ、

本願発明の、
「メディアコンテンツ」、
「観点」、
「重要度を表すスコア」に相当する。


(3)
引用例の上記(ス)の「1005は、重要度レベル選択ボタンで、それぞれのボタンに用意されている重要度レベルの名前が表示されている。例えば、利用者の名前であったり、アクションシーン、泣かせるシーンといった目的別の名前などが表示されている。他の重要度レベルを使って動画の提示を行うためには、ボタン1005を選択し直せばよい。窓1003の中では他の重要度レベルを選択すると、それに応じて指定されたボタンに対応する重要度レベルを表示するよう変更される。」という記載によれば、
「重要度レベルの名前」が表示された重要度レベル選択ボタンによって、ボタンに対応する重要度レベルを選択できるのであるから、重要度レベル選択ボタンに表示された「重要度レベルの名前」が対応する重要度レベルを選択するためのキーワードとしての機能を有していることは明らかであるから、

引用例発明の「場面の内容を表す少なくとも1つの重要度レベルの名前」は、

本願発明の「場面の内容を表す少なくとも1つのキーワード」に相当する。


(4)
引用例発明の
「複数の場面で構成される動画像の各場面を表す複数のカットと、
前記複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータと、
の両方を入力する入力部」と、

本願発明の
「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部と、
前記複数のセグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されている属性部と、
の両方を有し、前記メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データを入力する入力部」とは、

「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントと、
前記複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントの各々に割り当てられる情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されているデータと、
の両方を入力する入力部」という点で一致し、

本願発明では、「入力部」へ入力されるデータが、複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されている「データ構造部」と、前記セグメントの各々に割り当てられる「属性情報」として情報が記述されている「属性部」との両方を有する「メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データ」という構造を有しているのに対し、
引用例発明では、「データ構造部」と、「属性情報」として情報が記述されている「属性部」との両方を有する「メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データ」という構造を有していない点、

で相違する。


(5)
引用例発明の「前記目的別に各カットの重要度を表す重要度レベルに基づいて、カットを選択する提示部分選択部」と、

本願発明の「前記属性部に記述されている前記観点及び前記スコアの少なくとも一つ、または、前記観点及び前記スコアの少なくとも一つと前記時間情報との組み合わせに基づいて、前記データ構造部からセグメントを選択する選択部」(なお、発明特定事項として、「前記属性部に記述されている前記スコアに基づいて、前記データ構造部からセグメントを選択する選択部」を含むことは明らかである。)とは、

「前記スコアに基づいて、セグメントを選択する選択部」という点で一致し、

本願発明の「選択部」は、「前記属性部に記述されている」情報に基づいて「前記データ構造部から」セグメントを選択するのに対し、
引用例発明の「選択部」は、そのようなものではない点、

で相違する。


(6)
引用例発明の「カット単位で要約を作成することができる情報処理装置」は、

本願発明の「データ処理装置」に対応する。


(7)
したがって、本願発明と引用例発明とは、

「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントと、
前記複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントの各々に割り当てられる情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されているデータと、
の両方を入力する入力部と、
前記スコアに基づいて、セグメントを選択する選択部と、
を備えるデータ処理装置。」

という点で一致し、

本願発明では、「入力部」へ入力されるデータが、複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されている「データ構造部」と、前記セグメントの各々に割り当てられる「属性情報」として情報が記述されている「属性部」との両方を有する「メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データ」という構造を有しているのに対し、
引用例発明では、「データ構造部」と、「属性情報」として情報が記述されている「属性部」との両方を有する「メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データ」という構造を有していない点、

そのため、

本願発明の「選択部」は、「前記属性部に記述されている」情報に基づいて「前記データ構造部から」セグメントを選択するのに対し、
引用例発明の「選択部」は、そのようなものではない点、

で相違する。



5.相違点に対する判断

各種データ(例:番組映像などのメディアコンテンツ)を構造化して管理することは、例えば、

・本出願明細書の
「【0087】
この構成の文脈内容記述データをコンピュータ上で表現する一例として、Extensible Markup Language(XML)による記述を用いることができる。XMLはWorld Wide Web Consortiumによって標準化が進められているデータ記述言語であり、1998年2月10日にVer. 1.0が勧告された。XML ver. 1.0の仕様書は、http://www.w3.org/TR/1998/REC-xml-19980210で得られる。図58?図66は、本実施の形態の文脈内容記述データをXMLで記述するためのDocument Type Definition(DTD)と、このDTDによる文脈内容記述データの一例である。また、図67?図80は、図58?図66に示す文脈内容記述データに、代表画像(映像情報)やキーワード(音情報)などのメディアセグメントの代表データ(dominant-data)を追加した文脈内容記述データの一例と、該文脈内容記述データをXMLで記述するためのDTDである。」という記載、

・原査定の拒絶の理由に引用例2として引用された、柴田正啓ほか,放送メディアのための映像内容記述法,NHK技研R&D,日本,日本放送出版協会,1996年 8月15日,第41号,第1-7頁(特に、「4 インデックスに基づく映像の階層構造化」の欄を参照)、

・原査定の備考の欄に参考文献として引用された、特開平8-110912号公報、特開平7-306866号公報、特開平5-282379号公報、

・「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造と、前記カットの各々に割り当てられる記述内容である記述情報との両方を有するビデオ情報の階層構造」を開示する周知例発明、

にあるように、情報処理分野における周知技術である。

また、従来、構造化されていなかった各種データを、XML規格などを用いて構造化することにより、各種データの取扱いの利便性を図ることは、情報処理分野における周知の技術的潮流である。

したがって、情報処理分野における当該周知の技術的潮流に沿って、引用例発明に対して、各種データを構造化して管理する周知技術及び周知例発明を適用することによって、
引用例発明の「複数の場面で構成される動画像の各場面を表す複数のカット」(本願発明の「セグメント」に相当)を、周知例発明の「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」で表現し、
引用例発明の前記「カットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ」が記述されているデータを、周知例発明の「前記カットの各々に割り当てられる記述内容である記述情報」で表現することによって、
本願発明の如く、「入力部」へ入力されるデータを、複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されている「データ構造部」と、前記セグメントの各々に割り当てられる「属性情報」として情報が記述されている「属性部」との両方を有する「メディアコンテンツの文脈内容の構造を示す記述データである文脈内容記述データ」とすると共に、
「選択部」を「前記属性部に記述されている」情報に基づいて「前記データ構造部から」セグメントを選択するものとすることは、当業者が容易に想到し得ることである。



6.むすび

したがって、本願発明は、引用例発明及び周知技術に基づいて、当業者が容易に発明をすることができたものであり、特許法第29条第2項の規定により特許を受けることができないから、他の請求項について検討するまでもなく、本願は拒絶されるべきものである。

よって結論の通り審決する。
 
審理終結日 2009-12-01 
結審通知日 2009-12-08 
審決日 2009-12-21 
出願番号 特願2008-186374(P2008-186374)
審決分類 P 1 8・ 121- Z (G06F)
P 1 8・ 55- Z (G06F)
最終処分 不成立  
前審関与審査官 上嶋 裕樹長谷川 篤男池田 聡史  
特許庁審判長 田口 英雄
特許庁審判官 小曳 満昭
和田 財太
発明の名称 データ処理装置、データ処理方法および記録媒体  
代理人 橋本 公秀  
代理人 小栗 昌平  
代理人 市川 利光  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ