• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない。 G06F
管理番号 1198053
審判番号 不服2008-15786  
総通号数 115 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2009-07-31 
種別 拒絶査定不服の審決 
審判請求日 2008-06-20 
確定日 2009-05-28 
事件の表示 特願2006-313410「要約作成装置、データ処理方法およびデータ処理方法をコンピュータに実行させるためのプログラム」拒絶査定不服審判事件〔平成19年 3月29日出願公開、特開2007- 80290〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 第1 手続の経緯

本願は、平成11年12月9日(優先権主張平成10年12月25日、平成11年9月24日)に出願した特願平11-350479号の一部を平成18年11月20日に新たな特許出願としたものであって、平成20年5月14日付けで拒絶査定がなされ、これに対し、平成20年6月20日に拒絶査定不服審判の請求がなされるとともに、平成20年7月17日付けで手続補正がなされたものである。




第2 平成20年7月17日付けの手続補正についての補正却下の決定

〔結論〕

平成20年7月17日付けの手続補正を却下する。

〔理由〕

1.補正内容

平成20年7月17日付けの手続補正(以下、「本件補正」という)は、特許請求の範囲を補正するものであって、
本件補正前の特許請求の範囲第2項の「属性部」、すなわち、

「前記セグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、場面の内容を表す少なくとも1つのキーワードによって表される観点、及び観点に基づいた各セグメントの重要度を表すスコアが記述されている属性部」

であったものを、本件補正後の特許請求の範囲第2項の「属性部」、すなわち、

「前記セグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されている属性部」

に変更する本件補正事項を含む。


そして、本件補正事項は、観点とスコアが組として少なくとも1つ記述されていると限定するものであって、その補正前と補正後に記載される発明の産業上の利用分野及び解決しようとする課題は同一であるから、
本件補正事項は、特許法第17条の2第4項第2号に規定された「特許請求の範囲の減縮(第三十6条第5項の規定により請求項に記載した発明を特定するために必要な事項を限定するものであつて、その補正前の当該請求項に記載された発明とその補正後の当該請求項に記載される発明の産業上の利用分野及び解決しようとする課題が同一であるものに限る。)」に該当する。


そこで、本件補正後における特許請求の範囲に記載されている事項により構成される発明が特許出願の際独立して特許を受けることができるものであるか(特許法第17条の2第5項において準用する同法第126条第5項に規定する要件を満たすか)否かを、請求項2に係る発明(以下、「本願補正発明」という。)について以下に検討する。



2.本願補正発明の認定

本願補正発明は、本件補正によって補正された明細書及び図面の記載からみて、特許請求の範囲第2項に記載されたとおりのものと認められるところ、その請求項2に係る発明は、次のとおりのものである。

「 【請求項2】
複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部と、前記セグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されている属性部との両方を有する文脈内容記述データを入力する入力部と、
前記属性部に記述されている前記スコアと前記時間情報と前記観点との少なくとも一つに基づいて、前記データ構造部からセグメントを選択する選択部と、
前記メディアコンテンツを入力するコンテンツ入力部と、
前記選択部で選択されたセグメントの時間情報から前記メディアコンテンツの区間を抽出する抽出部と、
を備えた要約作成装置。」



3.引用例の認定

原査定の拒絶の理由に引用された、特開平8-255171号公報(以下、「引用例」という)には、図面と共に以下の技術事項が記載されている。

(ア)
「 【0001】
【産業上の利用分野】
本発明は、例えば映像、音声、文書等の情報を統合的に表示、記録、再生、編集するマルチメディア情報処理装置に関する。」

(イ)
「 【0002】
【従来の技術】
パーソナルコンピュータ(PC)などに搭載されるマイクロプロセッサの性能向上はめざましく、普及型のPCで大量の情報を高速に処理できる環境が整いつつあることは周知である。また、近年の光通信技術や通信制御技術、及び光磁気ディスクや高密度集積回路によるメモリ素子等の発展により前者において情報伝送路が大容量化し、後者において情報蓄積装置が大容量化していることも作用して、家庭やオフィスでも安価な装置で大量の情報を電子的に入手することができるといったことが実現しつつある。」

(ウ)
「 【0005】
これらの情報の分類、又は複数の情報の中から特徴となる部分を抽出する作業を自動化しようとする開発は、現在も盛んに行われている。しかし、それらの中の多くは人間の判断機構を代替することを目標としており、高度な人工知能を必要とし、開発の時間の面からも、また費用の面からも、現時点ではコストがかかりすぎるといわざるを得ない。また、そのような自動分類システムには、ユーザは自分が望むものを指示してやる必要があり、何が見たい、どのような情報を得たい、といったビジョンのはっきりしないユーザには扱いづらい。このような不案内なユーザは、情報があふれる時代にこそ激増するものと想定できる。」

(エ)
「 【0009】
【本発明が解決する課題】
以上詳述したように、従来の情報処理装置では、多種多様の情報を、情報の種類を越えて効率よく、かつ利用者の意図を反映して分類・整理などを行う手段がなかった。このために、利用者は、その情報の処理作業に時間と労力を割かなければならず、これを装置として自動で行う場合にも、必ずしも個々の利用者に適応して処理できないという欠点があった。また従来は情報の加工方法も繁雑で、その実現のためには高コストとなりやすいという欠点もあった。
【0010】
本発明は、上記実情に鑑みなされたものであり、多種多量の情報から簡便な操作で効率よく利用者が必要とする情報を加工、提示することのできる情報処理装置を提供することを目的とする。」

(オ)
「 【0022】
【実施例】
以下、図面を参照して本発明の実施例を説明する。
【0023】
(第1実施例)
図1は第1実施例に係る情報処理装置の構成を示すブロック図である。
【0024】
同実施例では、利用者の「重要である/ない」についての評価値を入力する方法として、利用者の視線を検出し、その視点の移動の様子から上記評価値(以下、重要度レベルという)を自動判定する場合について説明する。なお、視点の移動から重要度レベルを算出する方法については第3実施例において詳述する。
【0025】
記録媒体107から読み出し制御部105を介して読み取られた情報は、提示部106に表示されるが、そのときの利用者の視点は検出器101によって位置検出される。判定部102内では上記視点情報が一定時間分記録されて処理される。この処理は、例えば5秒分の利用者の視点を1/30秒ごとに検出し、150個データが集まるごとに重要度推定計算を行うなどというように行われる。判定部102では、送られてきた視点データから、その記録時間内での重要度レベルを算出する。この例では、5秒ごとに、前5秒の重要度レベルが出力されるというように行われる。ここで、重要度レベル算出は、記録間隔と同じ周期で行われる場合に限らない。例えば、今回送られてきた5秒分のデータのうち過去側2.5秒の視点データと、前回送られてきた5秒分のデータのうち現在側2.5秒のデータとを併せて重要度レベル算出を行う、という過程を間に入れることによって、2.5秒間隔で重要度レベル出力が可能になる。当然、同様の方法で出力間隔をさらに短くすることも可能である。
【0026】
判定部102より一定の出力間隔で送られる重要度レベルは、提示情報全体にわたって重要度情報一時記憶部110に記憶され、記録媒体107に記録される。ここでいう提示情報全体とは、1番組分、映画1本分、写真アルバムの1旅行分等のストーリーの1まとまりに対応する区間等で、通常これらは従来の方法で既に区切りがはっきりしている(VTRのインデックス信号、映画ソフトの1巻、アルバムの見出し、あるいはコンピュータデータの1ファイル等)。記録媒体107は、提示情報が記録されていたものと同一の媒体でも異なる媒体でも構わない。例えば、光磁気ディスクから読み出して提示した画像情報に関する重要度レベル情報は、もとの光磁気ディスクに保存してもよいし、重要度レベル保存用のメモリICを用いてもよい。あるいは通信ネットワークで結ばれた遠隔の記録装置から読み出して提示した情報(たとえばビデオ・オン・デマンド等)に関する重要度レベル情報を、ネットワークを介して元の記録装置に戻して記録してもよいし、利用者が端末として利用しているコンピュータ側で記録しておいてもよい。この例では、提示情報全体にわたって重要度情報を重要度情報一時記憶部110に一時記憶する場合を述べたが、情報提示中でも判定部102が、逐次、重要度判定を行い、記録媒体107において原情報提示と重要度情報記録が同時に行えるような条件下では、情報提示と並行して重要度情報を記録媒体107に記録してもよい。」

(カ)
「 【0049】
最後に、以上のようにして入力・補正された重要度レベルを用いて、自動的にもとの情報を加工・提示する方法について説明する。
【0050】
この場合、図1においては原情報と重要度レベル情報との両者が記録媒体107から読み出し制御部105を介して読み出され、それぞれ原情報一時記憶部113、重要度情報一時記憶部110に蓄積されるが、重要度情報一時記憶部110の重要度レベル情報に基づいて原情報のうちの提示すべき部分が提示部分選択部111によって選択される。これについては後で詳しく述べる。アドレス生成部112では、選択された部分に関する情報を提示部分選択部111より受け、記録媒体107上で提示すべき情報が記録されている場所をアドレスとして出力する。読み出し制御部105では、このアドレス情報に基づいて選択的に記録媒体107にアクセスし、原情報の部分を原情報一時記憶部113に送る。以降の過程はすでに説明した画面表示方法と同じである。」

(キ)
「 【0051】
ここでもちろん、アドレス生成部112では記録媒体からの読み出し場所を制御する代わりに、原情報一時記憶部113からの読み出し場所を制御してもよい。この場合、一般的に読み出しスピードの向上を望むことができる(現状では一般に記録媒体107に用いられる光磁気ディスクなどのアクセススピードよりも、原情報一時記憶部113に用いられる半導体メモリ素子の方が早い)。以下では提示部分選択部111で原情報の部分選択を行う過程を具体的に説明する。
【0052】
ここで説明する加工・提示の方法は、情報の意味的区切り(動画像のシーンチェンジ、音声・文書の文章単位や段落単位、音楽のフレーズ=4?16小節程度で構成される展開のパターン)を、既存の画像認識、音声認識など別の方法で検出し、その区切りを利用する場合と、しない場合の2通りがある。」

(ク)
「 【0053】
まず、区切りを利用しない場合について図6を用いて説明する。
【0054】
利用者は、情報加工の結果として生成される提示情報に希望する時間的長さを入力する。これはボリュームつまみのようなものによってもよいし、キーボードを用いて直接「何分何秒」と入力してもよい。即ち、時間長を入力する方法であれば、一般に用いられているいかなる方法でも構わない。本装置では、しきい値601を、規定の重要度レベル最大値Imax 602より徐々に下げてゆき、重要度レベルの時間推移603の中で、しきい値601を越える時間区間604の合計を計算する。この計算結果が入力された提示希望時間を越えるまで、しきい値601を下げる過程を続ける。このようにして提示希望時間を越える直前のしきい値601が決定したとき、本装置はしきい値601を越える時間区間604だけを順次提示する。あるいは、重要度レベルのしきい値以上の極大値605の瞬間の情報を画面に列挙しておき、その画面をマウスまたは注視などで選択したときには、この極大値を含んでしきい値を越える時間区間を提示するという方法もある。これによって、利用者は情報の全時間のうち、特に重要度の高い部分だけを選択的に見ることができる。」

(ケ)
「 【0055】
次に、情報の意味的区切りが既知で、それを利用する場合について図7を用いて説明する。
【0056】
まず情報が動画像である場合について説明する。
【0057】
動画像に対応して重要度レベル701が付与されており、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。1つのカット703内では、重要度レベルはそのカット703での最大の値704に一致させる。こうすることによって、上記の情報の区切りを利用しない場合と同じ方法が利用できる。
【0058】
即ち、しきい値705を徐々に下げ、しきい値705を越える時間区間の合計が設定された提示希望時間を越える直前のしきい値705を求める。このとき、しきい値705を越える時間区間、即ちカットを順次提示することによって、カット単位で要約を作成することができる。
【0059】
また、カット703内の重要度レベルを、そのカットでの最大の極大値を用いるかわりに、カット703内の重要度レベルの積分値をカット703の長さで割った「重要度レベル密度」706に一致させて、上記と同様のカット選択を行うこともできる。
【0060】
この2つの選択方法が持つ意味の違いは、前者(カット703内の重要度レベルは最大の極大値704)が、瞬間的な最大の印象の強さでカット703を評価するのに対して、後者(カット703内の重要度レベルはカット703内での平均値706)は、カット703全体が与えた印象の強さで評価していることである。」

(コ)
「 【0061】
以上の中で「順次提示」を行う際のアドレス生成部112の動作の例を図8を用いて説明する。
【0062】
図8中の折れ線グラフのうち、右にあるもの((b))は図6のグラフを90度回転したものである。図6を用いて説明した方法で選択された部分がハッチングして示してある。この様な場合、選択された部分を順次提示する時には、アドレス生成部112は、図8の左((a))に示すようなアドレスを出力する(ただしこれは記録媒体107上に原情報の時間経過と線形に記録がなされた場合である。時間経過と因果関係のない配置で原情報が記録されている場合、図8左のグラフの縦軸はアドレスの代わりに提示すべき時刻位置を示す)。即ち、要約提示の際、選択された時間区間では正常な動作速度で再生され、そうでない場所はスキップされる。選択された部分が上述のようにカット単位の場合でも動作は同じである。
【0063】
上記のようにして選択されたカットは、選ばれたカットを時間的に前にあるものから順次提示する方法の他に、カットの重要度レベルが高いものから順に提示する方法がある。その他にも、選択されたカットの先頭画面だけを小画面として画面に列挙し、利用者がその小画面をマウスや視線などで選択すると、そのカットの動画像が提示されるという方法もある。ここで、カットを代表させる画面はカットの先頭画面である必要はなく、そのカット中で最も高い重要度レベルを示した瞬間の画面を表示してもよい。あるいは、上で述べてきたような方法で提示すべき場所だけを選定しておき、それぞれの区間の提示時間の早さや方向、順序などは利用者の操作によって自由に変化させられるようになっていてもよい。このようにすると、例えば10秒ずつ30枚提示される静止画が原情報であるような場合、特に重要な画像10枚だけを重要度レベルのしきい値をもちいて選択しておき、その10枚中の1枚1枚は好きな時間だけ見る、といったことが可能になる。」

(サ)
「 【0066】
(第2実施例)
次に第2実施例として、本発明の情報処理装置においてユーザが行う処理、及び提示部での表示について図を用いてより詳細に説明する。
【0067】
同実施例では入力のためのポインティングデバイスにマウスを使用することを仮定しているが、本発明に係る情報処理装置においては、いかなるポインティングデバイスでも使用可能である。
【0068】
まず、ユーザが重要度レベルを利用して動画像の提示を行う場合のユーザの操作、及び提示部での表示について説明する。
【0069】
ユーザが動画像を提示させるときには、提示部にはたとえば図10又は図11のような表示を行う。図10は表示させる動画像を大きく表示させており、一方図11では動画像に付与された重要度レベルを同一画面内で明示している。これらの表示方法は、用途によってユーザが選べるようにしておく。ここで、1000は重要度レベルを利用して動画の表示を行うときに重要度レベルのしきい値を調節するためのレバーで、レバーを上に上げれば動画像の重要度レベルの高い部分のみが提示されるようになり、逆に下に下げれば重要度レベルの低い部分までも提示されるようになる。これは、第1実施例で図6や図7を用いて説明したのと同様である。
【0070】
1001は、提示時間表示窓であり、レバー1000によって重要度レベルのしきい値が設定されたときに、一つの動画の中でしきい値を上回る重要度レベルが付与された部分の合計がどの程度の時間になるかを表示するものである。この図の例では12分41秒となっている。ユーザは動画の大まかな内容をある時間内で見てしまいたいときには、窓1001の中の時間を見ながらレバー1000を調整すればよい。もちろん、第1実施例で説明したように、直接窓1001の中に時間を打ち込むことにより、重要度レベルのしきい値を設定することも可能である。この際には、窓1001にマウスカーソルをあわせてクリックし、次にキーボード等の入力装置から時間を入力する。希望の時間に設定ができたら、1008の操作ボタンのうち、「はじめから再生する」ボタンを押すことにより、動画の中の重要度レベルの高い部分だけを希望の時間内で見ることができる。この際には、第1実施例で説明した情報の意味的区切りを利用する場合、及び利用しない場合のどちらでも場合においても同様の手続きによって動画の提示を行うことができる。」

(シ)
「 【0074】
ここまで重要度レベルは動画一つにつき一種類しか付与されていないことを前提に説明してきたが、重要度レベルは複数付与することも可能である。例えば、一つの動画や音声、静止画群に対しても利用者ごとに重要度レベルを用意することもできるし、また、目的別によっていくつかの重要度レベルを付与することも可能である。具体的には、例えば動画がドラマであったときに、アクションシーンを見るといった目的や、泣かせるシーンを見たいといった目的でそれぞれ別の重要度レベルを付与することができる。」

(ス)
「 【0075】
1005は、重要度レベル選択ボタンで、それぞれのボタンに用意されている重要度レベルの名前が表示されている。例えば、利用者の名前であったり、アクションシーン、泣かせるシーンといった目的別の名前などが表示されている。他の重要度レベルを使って動画の提示を行うためには、ボタン1005を選択し直せばよい。窓1003の中では他の重要度レベルを選択すると、それに応じて指定されたボタンに対応する重要度レベルを表示するよう変更される。」

(セ)
「 【0115】
【発明の効果】
以上詳述したように、本発明に係る情報処理装置によれば、マルチメディア情報に例えば重要度レベルという付加情報を付与、修正することが可能になり、その重要度レベルを用いた情報の特徴抽出が、利用者の意図を反映した形式で、かつ高度な知識処理を必要とせず実現することができる。
【0116】
このように、情報の特徴抽出が容易になることで、利用者が情報にアクセスする時間の短縮が可能になり、ネットワークへの負担軽減に寄与するとともに利用者に専門的な知識を強要することのない使いやすい情報アクセスのインタフェースを提供できる。」


以上の引用例の記載によれば、引用例には以下の事項が開示されていると認められる。

(a)
一般的に、「カット」が「映画の構成単位。一つの連続した場面。また、それが写っているフィルム。」(「株式会社岩波書店 広辞苑第五版」より抜粋)を意味し、「シーン」が「映画・演劇などの一場面。」(株式会社岩波書店 広辞苑第五版」より抜粋)を意味すること、すなわち、「カット」や「シーン」は『場面』に対する用語であることは世間常識であること、

引用例の上記(ケ)の「次に、情報の意味的区切りが既知で、それを利用する場合について図7を用いて説明する。・・・(中略)・・・動画像に対応して重要度レベル701が付与されており、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。1つのカット703内では、重要度レベルはそのカット703での最大の値704に一致させる。こうすることによって、上記の情報の区切りを利用しない場合と同じ方法が利用できる。」という記載、
(なお、「・・・、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。」という記載から、「動画像の意味的区切りであるシーンチェンジ」が、場面の「意味区切り」である「シーンチェンジ」という時間情報を表していることは明らかである。)

引用例の上記(シ)の「ここまで重要度レベルは動画一つにつき一種類しか付与されていないことを前提に説明してきたが、重要度レベルは複数付与することも可能である。例えば、一つの動画や音声、静止画群に対しても利用者ごとに重要度レベルを用意することもできるし、また、目的別によっていくつかの重要度レベルを付与することも可能である。具体的には、例えば動画がドラマであったときに、アクションシーンを見るといった目的や、泣かせるシーンを見たいといった目的でそれぞれ別の重要度レベルを付与することができる。」という記載、
(なお、「・・・、重要度レベルは複数付与することも可能である。・・・(中略)・・・、また、目的別によっていくつかの重要度レベルを付与することも可能である。」という記載から、目的別に重要度レベルが少なくとも1つ付与されていること、すなわち、目的と目的別の重要度レベルの組が少なくとも1つあることは明らかである。)

引用例の上記(ス)の「1005は、重要度レベル選択ボタンで、それぞれのボタンに用意されている重要度レベルの名前が表示されている。例えば、利用者の名前であったり、アクションシーン、泣かせるシーンといった目的別の名前などが表示されている。他の重要度レベルを使って動画の提示を行うためには、ボタン1005を選択し直せばよい。窓1003の中では他の重要度レベルを選択すると、それに応じて指定されたボタンに対応する重要度レベルを表示するよう変更される。」という記載から、

引用例には、「複数の場面で構成される動画像の各場面を表す複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータ」が開示されていると認められる。


(b)
上記(a)の「複数の場面で構成される動画像の各場面を表す複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータ」を有するという開示、

引用例の上記(カ)の「最後に、以上のようにして入力・補正された重要度レベルを用いて、自動的にもとの情報を加工・提示する方法について説明する。・・・(中略)・・・この場合、図1においては原情報と重要度レベル情報との両者が記録媒体107から読み出し制御部105を介して読み出され、それぞれ原情報一時記憶部113、重要度情報一時記憶部110に蓄積されるが、重要度情報一時記憶部110の重要度レベル情報に基づいて原情報のうちの提示すべき部分が提示部分選択部111によって選択される。これについては後で詳しく述べる。」という記載、

引用例の上記(キ)の「以下では提示部分選択部111で原情報の部分選択を行う過程を具体的に説明する。・・・(中略)・・・ここで説明する加工・提示の方法は、情報の意味的区切り(動画像のシーンチェンジ、音声・文書の文章単位や段落単位、音楽のフレーズ=4?16小節程度で構成される展開のパターン)を、既存の画像認識、音声認識など別の方法で検出し、その区切りを利用する場合と、しない場合の2通りがある。」という記載、
引用例の上記(ク)の「まず、区切りを利用しない場合について図6を用いて説明する。・・・(中略)・・・利用者は、情報加工の結果として生成される提示情報に希望する時間的長さを入力する。・・・(中略)・・・本装置では、しきい値601を、規定の重要度レベル最大値Imax 602より徐々に下げてゆき、重要度レベルの時間推移603の中で、しきい値601を越える時間区間604の合計を計算する。この計算結果が入力された提示希望時間を越えるまで、しきい値601を下げる過程を続ける。このようにして提示希望時間を越える直前のしきい値601が決定したとき、本装置はしきい値601を越える時間区間604だけを順次提示する。」という記載、
(当該記載から、情報の意味的区切りを利用しない場合、時間区間に基づいて所望の動画像を選択していることは明らかである。)

引用例の上記(ケ)の「次に、情報の意味的区切りが既知で、それを利用する場合について図7を用いて説明する。・・・(中略)・・・動画像に対応して重要度レベル701が付与されており、動画像の意味的区切りであるシーンチェンジ702がわかっているとする。時間的にとなりあう2つのシーンチェンジ702間の時間区間をカット703と呼ぶことにする。1つのカット703内では、重要度レベルはそのカット703での最大の値704に一致させる。こうすることによって、上記の情報の区切りを利用しない場合と同じ方法が利用できる。・・・(中略)・・・このとき、しきい値705を越える時間区間、即ちカットを順次提示することによって、カット単位で要約を作成することができる。」という記載、
(当該記載及び情報の意味的区切りを利用しない場合の記載から、情報の意味的区切りを利用する場合、シーンチェンジによって決定される時間区間という時間情報に基づいてカットを選択していることは明らかである。)

引用例の上記(サ)の「次に第2実施例として、本発明の情報処理装置においてユーザが行う処理、及び提示部での表示について図を用いてより詳細に説明する。・・・(中略)・・・ユーザが動画像を提示させるときには、提示部にはたとえば図10又は図11のような表示を行う。図10は表示させる動画像を大きく表示させており、一方図11では動画像に付与された重要度レベルを同一画面内で明示している。これらの表示方法は、用途によってユーザが選べるようにしておく。ここで、1000は重要度レベルを利用して動画の表示を行うときに重要度レベルのしきい値を調節するためのレバーで、レバーを上に上げれば動画像の重要度レベルの高い部分のみが提示されるようになり、逆に下に下げれば重要度レベルの低い部分までも提示されるようになる。これは、第1実施例で図6や図7を用いて説明したのと同様である。・・・(中略)・・・1001は、提示時間表示窓であり、レバー1000によって重要度レベルのしきい値が設定されたときに、一つの動画の中でしきい値を上回る重要度レベルが付与された部分の合計がどの程度の時間になるかを表示するものである。この図の例では12分41秒となっている。ユーザは動画の大まかな内容をある時間内で見てしまいたいときには、窓1001の中の時間を見ながらレバー1000を調整すればよい。もちろん、第1実施例で説明したように、直接窓1001の中に時間を打ち込むことにより、重要度レベルのしきい値を設定することも可能である。この際には、窓1001にマウスカーソルをあわせてクリックし、次にキーボード等の入力装置から時間を入力する。希望の時間に設定ができたら、1008の操作ボタンのうち、「はじめから再生する」ボタンを押すことにより、動画の中の重要度レベルの高い部分だけを希望の時間内で見ることができる。この際には、第1実施例で説明した情報の意味的区切りを利用する場合、及び利用しない場合のどちらでも場合においても同様の手続きによって動画の提示を行うことができる。」という記載から、
(当該記載から、第1実施例で説明した情報の意味的区切りを利用する場合、重要度レベル又はシーンチェンジによって決定される時間区間という時間情報に基づいてカットを選択していることは明らかである。)

引用例には、「前記目的別に各カットの重要度を表す重要度レベル又は前記シーンチェンジに基づいて、カットを選択する提示部分選択部」が開示されていると認められる。


(c)
上記(a)の「複数の場面で構成される動画像の各場面を表す複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータ」を有するという開示、

上記(b)の「前記目的別に各カットの重要度を表す重要度レベル又は前記シーンチェンジに基づいて、カットを選択する提示部分選択部」という開示、

引用例の上記(カ)の「最後に、以上のようにして入力・補正された重要度レベルを用いて、自動的にもとの情報を加工・提示する方法について説明する。・・・(中略)・・・この場合、図1においては原情報と重要度レベル情報との両者が記録媒体107から読み出し制御部105を介して読み出され、それぞれ原情報一時記憶部113、重要度情報一時記憶部110に蓄積されるが、重要度情報一時記憶部110の重要度レベル情報に基づいて原情報のうちの提示すべき部分が提示部分選択部111によって選択される。これについては後で詳しく述べる。アドレス生成部112では、選択された部分に関する情報を提示部分選択部111より受け、記録媒体107上で提示すべき情報が記録されている場所をアドレスとして出力する。読み出し制御部105では、このアドレス情報に基づいて選択的に記録媒体107にアクセスし、原情報の部分を原情報一時記憶部113に送る。以降の過程はすでに説明した画面表示方法と同じである。」という記載、

引用例の上記(コ)の「以上の中で「順次提示」を行う際のアドレス生成部112の動作の例を図8を用いて説明する。・・・(中略)・・・図8中の折れ線グラフのうち、右にあるもの((b))は図6のグラフを90度回転したものである。図6を用いて説明した方法で選択された部分がハッチングして示してある。この様な場合、選択された部分を順次提示する時には、アドレス生成部112は、図8の左((a))に示すようなアドレスを出力する(ただしこれは記録媒体107上に原情報の時間経過と線形に記録がなされた場合である。時間経過と因果関係のない配置で原情報が記録されている場合、図8左のグラフの縦軸はアドレスの代わりに提示すべき時刻位置を示す)。即ち、要約提示の際、選択された時間区間では正常な動作速度で再生され、そうでない場所はスキップされる。選択された部分が上述のようにカット単位の場合でも動作は同じである。」という記載から、

引用例には、
「前記動画像と、
前記提示部分選択部で選択されたカットに関する情報から前記動画像の時間区間を選択するアドレス生成部」が開示されていると認められる。


(d)
引用例の上記(エ)の「本発明は、上記実情に鑑みなされたものであり、多種多量の情報から簡便な操作で効率よく利用者が必要とする情報を加工、提示することのできる情報処理装置を提供することを目的とする。」という記載、

引用例の上記(ケ)の「即ち、しきい値705を徐々に下げ、しきい値705を越える時間区間の合計が設定された提示希望時間を越える直前のしきい値705を求める。このとき、しきい値705を越える時間区間、即ちカットを順次提示することによって、カット単位で要約を作成することができる。」という記載から、

引用例には、「カット単位で要約を作成することができる情報処理装置」が開示されていると認められる。


以上の引用例の記載によれば、引用例には下記の発明(以下、「引用例発明」という。)が開示されていると認められる。

「複数の場面で構成される動画像の各場面を表す複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータと、
前記目的別に各カットの重要度を表す重要度レベル又は前記シーンチェンジに基づいて、カットを選択する提示部分選択部と、
前記動画像と、
前記提示部分選択部で選択されたカットに関する情報から前記動画像の時間区間を選択するアドレス生成部と、
を備えた、カット単位で要約を作成することができる情報処理装置。」



4.周知例の認定

上田博唯(外3名),動画像解析に基づくビデオ構造の視覚化とその応用,電子情報通信学会論文誌,社団法人電子情報通信学会,1993年08月25日,Vol.J76-D-II,No.8,p.1572-p.1580(以下、「周知例」という)には、図面と共に以下の技術事項が記載されている。

(ア)
「あらまし ビデオ情報の構造に自動記述を行うための機能を開発し,これらの機能によって得られるビデオの時間空間構造をビジュアライゼーションする新しい手法を開発した.機能は,カット分割,カメラと被写体の動き,被写体の軌跡や輪郭線,特定の被写体の存在の判定およびその存在期間の記述等を提供する.更に,被写体の存在判定結果を用いて,同じ被写体はビデオ全体を通じて自動的にリンクされる.このようにして得られるリンクをオブジェクトリンクと名付ける.オブジェクトリンクによるナビゲーションと画像解析結果によってサポートされるビジュアライゼーション手法は,ユーザが生のビデオデータのみならず,ビデオ情報の構造,そしてこれに付加された記述内容を,ダイレクトマニピュレーション(直接操作)によって自由に編集することを可能とした.」
(第1572頁の「あらまし」の欄)

(イ)
「2. 基本構想
図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.シンボリックな記述は,人や物や場所の名前,そしてそれらの行動や関係などの言語的あるいは意味的な情報からなる.視覚的な記述は,対象物の形状や位置,対象物の運動軌跡,対象物が画面に入った時刻と出た時刻,複数の対象物が出会った時刻というような幾何学的あるいは時間的な情報からなる.本研究ではこれらの記述情報をできる限りシステムが自動抽出し,更にそれらの間をハイパリンクで結び付けることによって,ユーザに自由で柔軟な編集環境を提供することを目指している.」
(第1573頁左欄第18行から同頁右欄第3行)

(ウ)
「3. ビデオ解析機能
3.1 カット分割機能
従来のビデオ編集では長い映像を,一まとまりごとのカットに分割する作業に多大な時間を費やしていた.映像編集をシステムがサポートするためにはカットの自動分割が不可欠である.カットの自動分割方式として種々の提案があるが^((10)),筆者らはフレームを8×6の小領域に分割し,次フレームとの間で,その領域ごとの類似度を求め,これがしきい値を超える領域の数をフレーム間相関値と定義している.そして,このフレーム間相関値の時間差分がしきい値を超えたときにカットの変化点であると判定する^((11)).カットが分割されると,それぞれに縮小画像アイコン(マイコン)を作成し,ビデオ機器から供給されるイン点とアウト点のタイムコードと共に記憶する(後述の図2参照).」
(第1573頁右欄第30行から第1574頁左欄第1行)

(エ)
「4. 視覚化(Visualization)
4.1 ビデオ情報の記述
視覚化を有効にするためには,ビデオの階層構造を適切に記述することが重要である.MITのDavenportのグループは,ユーザが意味的情報(カメラ位置,照明,アクションおよび解説等の構造)を,構造的な変数としてビデオに付加するシステムを開発している^((7)).このシステムではユーザが付加するアノテーションをstrata(断層構造)として表現することを試みている.すなわち,異なる視点で付けられたアノテーションがフラットに層を成して積み重ねられる構造である.
これに対し筆者らのシステムでは,ユーザが付加したアノテーションのみならず,ビデオの解析機能から自動的に供給される記述の視覚化を重視している.筆者らの記述の基本は,自動カット分割と対象物の存在判定の結果であり,分割されたカットごとの各種構造情報が,まず図2に示すような記述として格納される.イン点,アウト点のタイムコードとマイコン画像もここに格納されるが,運動解析機能で得られるカメラや対象物(被写体)の運動データはmotionポインタで指示される領域に格納される.そして対象物抽出機能によって得られる対象物の存在期間は,extractionポインタで指される領域に格納される.フレームごとに得られた輪郭線(これから運動軌跡もわかる)データは,更にその先のe-counterポインタが指す領域に格納される.annotationポインタが指す領域には,ユーザがキーボード等から入力するそのカットへの注釈が格納される.
一方,対象物存在判定機能によって得られる情報は,図3に示す形式で格納される.対象物存在判定を行うたびにこのリストは右の方に延びていく.判定は通常複数のカットに対してなされるので,そのカットごとに得られた判定結果が,カットポインタの先のリストとして並ぶ.カット番号を格納しておくことにより,図2の記述情報との対応をとる.ここからオブジェクトポインタで指される先に対象物存在判定機能で得られた存在期間と大まかな形状・位置情報が格納される.対象物が出入りするために,一つのカット内で複数回見つかることがあるのでリスト形式としている.また,対象物抽出機能が,この対象物に対して起動された場合には,それと対応をとるために,extract番号をここに格納しておく.」
(第1574頁右欄第35行から第1575頁右欄第6行)


以上の周知例の記載によれば、周知例には以下の事項が開示されていると認められる。

(a)
一般的に、「カット」が「映画の構成単位。一つの連続した場面。また、それが写っているフィルム。」(「株式会社岩波書店 広辞苑第五版」より抜粋)を意味すること、すなわち、「カット」は『場面』に対する用語であることは世間常識であること、

周知例の上記(イ)の「図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.」という記載から、

周知例には、「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」が開示されていると認められる。


(b)
上記(a)の「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」という開示、

周知例の上記(イ)の「図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.シンボリックな記述は,人や物や場所の名前,そしてそれらの行動や関係などの言語的あるいは意味的な情報からなる.視覚的な記述は,対象物の形状や位置,対象物の運動軌跡,対象物が画面に入った時刻と出た時刻,複数の対象物が出会った時刻というような幾何学的あるいは時間的な情報からなる.本研究ではこれらの記述情報をできる限りシステムが自動抽出し,更にそれらの間をハイパリンクで結び付けることによって,ユーザに自由で柔軟な編集環境を提供することを目指している.」という記載、

周知例の上記(ア)の「オブジェクトリンクによるナビゲーションと画像解析結果によってサポートされるビジュアライゼーション手法は,ユーザが生のビデオデータのみならず,ビデオ情報の構造,そしてこれに付加された記述内容を,ダイレクトマニピュレーション(直接操作)によって自由に編集することを可能とした.」という記載から、
(なお、「ビデオ情報の構造,そしてこれに付加された記述内容」という記載から、記述内容がカットの各々に割り当てられていることは明らかである。)

周知例には、「前記カットの各々に割り当てられる記述内容である記述情報」が開示されていると認められる。


(c)
上記(a)の「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」という開示、

上記(b)の「前記カットの各々に割り当てられる記述内容である記述情報」という開示、

周知例の上記(イ)の「図1にビデオ情報の階層構造を示す.最上層はシナリオであり,多くのシーンから構成される全体のストーリである.各シーンは1個以上のカットからなる。シーンはその構成要素として,サブシーンをもつこともある.この構造においては,上部の層はシンボリックな記述,下部の層はより視覚的な記述からなる.この構造の最も低い部分(すなわちカット)には,生のビデオデータが含まれる.」という記載から、

周知例には、「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造と、前記カットの各々に割り当てられる記述内容である記述情報との両方を有するビデオ情報の階層構造」が開示されていると認められる。


すなわち、周知例には下記の発明(以下、「周知例発明」という。)が開示されていると認められる。

「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造と、前記カットの各々に割り当てられる記述内容である記述情報との両方を有するビデオ情報の階層構造」



5.対比

本願補正発明と引用例発明とを対比する。

(1)
引用例発明の、
「カット」、
「場面の意味的区切りを表すシーンチェンジ」は、それぞれ、

本願補正発明の、
「セグメント」、
「場面の区切りを表す時間情報」に相当することは、

本出願明細書の
「 【0094】
は、ひとつのシーンカットを表し、
と同様のpriorityと、該当シーンの時間情報として、開始時間を表すstartと、終了時間を表すendとが、属性として付加される。シーンカットの方法は、市販されていたり、ネットワークで流通しているソフトを用いても良いし、人手で行っても良い。なお、本実施の形態では、時間情報をシーンカットの開始時間と終了時間としたが、時間情報として開始時間と該当シーンの継続時間としても同様の効果が得られる。この場合、該当シーンの終了時間は、開始時間に継続時間を加算して求められる。」
という記載から明らかである。


(2)
引用例発明の、
「動画像」、
「目的」、
「重要度レベル」は、それぞれ、

本願補正発明の、
「メディアコンテンツ」、
「観点」、
「重要度を表すスコア」に相当する。


(3)
引用例の上記(ス)の「1005は、重要度レベル選択ボタンで、それぞれのボタンに用意されている重要度レベルの名前が表示されている。例えば、利用者の名前であったり、アクションシーン、泣かせるシーンといった目的別の名前などが表示されている。他の重要度レベルを使って動画の提示を行うためには、ボタン1005を選択し直せばよい。窓1003の中では他の重要度レベルを選択すると、それに応じて指定されたボタンに対応する重要度レベルを表示するよう変更される。」という記載によれば、
「重要度レベルの名前」が表示された重要度レベル選択ボタンによって、ボタンに対応する重要度レベルを選択できるのであるから、重要度レベル選択ボタンに表示された「重要度レベルの名前」が対応する重要度レベルを選択するためのキーワードとしての機能を有していることは明らかであるから、

引用例発明の「場面の内容を表す少なくとも1つの重要度レベルの名前」は、

本願補正発明の「場面の内容を表す少なくとも1つのキーワード」に相当する。


(4)
引用例発明の「複数の場面で構成される動画像の各場面を表す複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータ」と、

本願補正発明の「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部と、前記セグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されている属性部との両方を有する文脈内容記述データを入力する入力部」とは、

「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントの各々に関連する情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されているデータ」を有する点で一致し、

・本願補正発明の「データ」は、「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部」と、「前記セグメントの各々に割り当てられる属性情報」として情報が記述されている「属性部」との両方を有する「文脈内容記述データ」であるのに対し、引用例発明の「データ」は、そのようなものではない点、

・本願補正発明では、「データ」を入力する「入力部」を備えているのに対し、引用例発明では、「データ」を入力する入力部を備えていることが明記されていない点、

で相違する。


(5)
引用例発明の「前記目的別に各カットの重要度を表す重要度レベル又は前記シーンチェンジに基づいて、カットを選択する提示部分選択部」と、

本願補正発明の「前記属性部に記述されている前記スコアと前記時間情報と前記観点との少なくとも一つに基づいて、前記データ構造部からセグメントを選択する選択部」とは、

「前記スコアと前記時間情報と前記観点との少なくとも一つに基づいて、セグメントを選択する選択部」という点で一致し、

本願補正発明では、「前記属性部に記述されている」情報に基づいて「前記データ構造部から」セグメントを選択するのに対し、引用例発明では、そのようになっていない点、

で相違する。


(6)
引用例発明の「前記動画像」と、

本願補正発明の「前記メディアコンテンツを入力するコンテンツ入力部」とは、

「前記メディアコンテンツ」という点で一致し、

本願補正発明では、前記メディアコンテンツを入力する「コンテンツ入力部」を備えているのに対し、引用例発明では、前記メディアコンテンツを入力するコンテンツ入力部を備えていることが明記されていない点、

で相違する。


(7)
引用例発明の「前記提示部分選択部で選択されたカットに関する情報から前記動画像の時間区間を選択するアドレス生成部」と、

本願補正発明の「前記選択部で選択されたセグメントの時間情報から前記メディアコンテンツの区間を抽出する抽出部」とは、

「前記選択部で選択されたセグメントに関する情報から前記メディアコンテンツの区間を抽出する抽出部」という点で一致し、

・本願補正発明の「セグメントに関する情報」は「セグメントの時間情報」であるのに対し、引用例発明の「セグメントに関する情報」が「セグメントの時間情報」であるのか明記されていない点、


で相違する。


(8)
引用例発明の「カット単位で要約を作成することができる情報処理装置」は、

本願補正発明の「要約作成装置」に対応する。


(9)
したがって、本願補正発明と引用例発明とは、

「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントの各々に関連する情報である、場面の区切りを表す時間情報、及び場面の内容を表す少なくとも1つのキーワードによって表される観点と、前記観点に基づいた各セグメントの重要度を表すスコアの組が少なくとも1つ記述されているデータと、
前記スコアと前記時間情報と前記観点との少なくとも一つに基づいて、セグメントを選択する選択部と、
前記メディアコンテンツと、
前記選択部で選択されたセグメントに関する情報から前記メディアコンテンツの区間を抽出する抽出部と、
を備えた要約作成装置。」

という点で一致し、

(相違点1)
本願補正発明の「データ」は、「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部」と、「前記セグメントの各々に割り当てられる属性情報」として情報が記述されている「属性部」との両方を有する「文脈内容記述データ」であるのに対し、引用例発明の「データ」は、そのようなものではない点、

そのため、

本願補正発明では、「前記属性部に記述されている」情報に基づいて「前記データ構造部から」セグメントを選択するのに対し、引用例発明では、そのようになっていない点、


(相違点2)
本願補正発明では、「データ」を入力する「入力部」を備えているのに対し、引用例発明では、「データ」を入力する入力部を備えていることが明記されていない点、


(相違点3)
本願補正発明では、前記メディアコンテンツを入力する「コンテンツ入力部」を備えているのに対し、引用例発明では、前記メディアコンテンツを入力するコンテンツ入力部を備えていることが明記されていない点、

(相違点4)
本願補正発明の「セグメントに関する情報」は「セグメントの時間情報」であるのに対し、引用例発明の「セグメントに関する情報」が「セグメントの時間情報」であるのか明記されていない点、


で相違する。



6.相違点に対する判断

(1)相違点1について

本出願当初明細書段落の
「 【0096】
この構成の文脈内容記述データをコンピュータ上で表現する一例として、Extensible Markup Language(XML)による記述を用いることができる。XMLはWorld Wide Web Consortiumによって標準化が進められているデータ記述言語であり、1998年2月10日にVer. 1.0が勧告された。XML ver. 1.0の仕様書は、http://www.w3.org/TR/1998/REC-xml-19980210で得られる。図3?図9は、本実施の形態の文脈内容記述データをXMLで記述するためのDocument Type Definition(DTD)と、このDTDによる文脈内容記述データの一例である。また、図10?図19は、図3?図9に示す文脈内容記述データに、代表画像(映像情報)やキーワード(音情報)などのメディアセグメントの代表データ(dominant-data)を追加した文脈内容記述データの一例と、該文脈内容記述データをXMLで記述するためのDTDである。」
で提示された周知のXML規格のように、各種データを構造化して管理することは、情報処理分野において周知である。

また、原査定の拒絶の理由に引用された、柴田正啓ほか,放送メディアのための映像内容記述法,NHK技研R&D,日本,日本放送出版協会,1996年 8月15日,第41号,第1-7頁(特に、「4 インデックスに基づく映像の階層構造化」の欄を参照)にあるように、
番組映像(メディアコンテンツの一種)に関する情報を階層的に構成することは既知である。

更に、本願補正発明や引用例発明のようなメディアコンテンツを取り扱う分野では、周知例発明にあるように、
「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造と、前記カットの各々に割り当てられる記述内容である記述情報との両方を有するビデオ情報の階層構造」
を用いて、各種データを構造化することにより、メディアコンテンツを管理することは周知技術である。

したがって、引用例発明に対して、各種データを構造化して管理する周知技術、及び周知例発明を適用し、
引用例発明の「複数の場面で構成される動画像の各場面を表す複数のカット」(本願補正発明の「セグメント」に相当)を周知例発明の「複数の場面で構成されるビデオ情報の各場面を表す複数のカットが記述されている構造」で表現し、
引用例発明の前記「カットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ」を周知例発明の「前記カットの各々に割り当てられる記述内容である記述情報」で表現することによって、
本願補正発明の如く「複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部」と、「前記セグメントの各々に割り当てられる属性情報」として情報が記述されている「属性部」との両方を有する「文脈内容記述データ」とすると共に、「前記属性部に記述されている」情報に基づいて「前記データ構造部から」セグメントを選択することは、当業者が容易に想到し得ることである。


(2)相違点2について

引用例発明の「データ」は、選択部における選択のために必要な情報であるから、引用例発明の「データ」を何らかの方法で入力する必要があることは明らかである。

また、データ処理装置がある処理を実行する場合、当該処理を実行するための処理部を設けることは、情報処理分野における周知技術である。

しかも、データを入力するための処理部(たとえば、「入力部」)は、情報処理分野における周知技術である。

したがって、引用例発明に対して、当該周知技術を適用することによって、「データ」を入力する「入力部」を設けることは、当業者が容易に想到し得ることである。


(3)相違点3について

引用例発明のメディアコンテンツは、要約作成のために必要な情報であるから、引用例発明のメディアコンテンツを何らかの方法で入力する必要があることは明らかである。

また、データ処理装置がある処理を実行する場合、当該処理を実行するための処理部を設けることは、情報処理分野における周知技術である。

しかも、データを入力するための処理部(たとえば、「入力部」)は、情報処理分野における周知技術である。

したがって、引用例発明に対して、当該周知技術を適用することによって、メディアコンテンツを入力するコンテンツ入力部を設けることは、当業者が容易に想到し得ることである。


(4)相違点4について

引用例発明が備える「前記提示部分選択部で選択されたカットに関する情報から前記動画像の時間区間を選択し、選択された時間区間では正常な動作速度で再生され、そうでない場所はスキップされるアドレス生成部」では、
「カットに関する情報」から『時間情報』を選択しているのであるから、「カットに関する情報」は時間に関する情報が好ましいことは明らかである。

また、引用例発明が備える「複数の場面で構成される動画像の各場面を表す複数のカットの各々に関連する情報である、場面の意味的区切りを表すシーンチェンジ、及び場面の内容を表す少なくとも1つの重要度レベルの名前によって表される目的、及び前記目的別に各カットの重要度を表す重要度レベルの組が少なくとも1つ記述されているデータ」には、複数の場面で構成される動画像の各場面を表す複数のカットの各々に関連する情報である、「場面の意味的区切りを表すシーンチェンジ」(本願補正発明の「場面の区切りを表す時間情報」に相当する。)という時間情報を有している。

しかも、当該「シーンチェンジ」という時間情報は、「場面の意味的区切り」を表すものであるから、当該時間情報によって、動画像の時間区間を選択できる情報であることは明らかである。

したがって、引用例発明の「セグメントに関する情報」を「セグメントの時間情報」とすることは、当業者が容易に想到し得ることである。



7.むすび

以上のことから、本願補正発明は、引用例発明に基づいて、当業者が容易に発明をすることができたものであり、特許法第29条第2項の規定により、特許出願の際独立して特許を受けることができない。

したがって、本件補正は、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第5項において準用する同法第126条第5項の規定に違反するので、同法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。




第3 本願発明について

1.本願発明

平成20年7月17日付けの手続補正は上記のとおり却下されたので、本願の請求項2に係る発明は、平成20年3月21日付けの手続補正書の特許請求の範囲第2項に記載されたとおりのものと認められるところ、その請求項2に係る発明(以下、「本願発明」という。)は、次のとおりのものである。

「 【請求項2】
複数の場面で構成されるメディアコンテンツの各場面を表す複数のセグメントが記述されているデータ構造部と、前記セグメントの各々に割り当てられる属性情報である、場面の区切りを表す時間情報、場面の内容を表す少なくとも1つのキーワードによって表される観点、及び観点に基づいた各セグメントの重要度を表すスコアが記述されている属性部
との両方を有する文脈内容記述データを入力する入力部と、
前記属性部に記述されている前記スコアと前記時間情報と前記観点との少なくとも一つに基づいて、前記データ構造部からセグメントを選択する選択部と、
前記メディアコンテンツを入力するコンテンツ入力部と、
前記選択部で選択されたセグメントの時間情報から前記メディアコンテンツの区間を抽出する抽出部と、
を備えた要約作成装置」



2.引用例の認定

原査定の拒絶の理由で引用された引用例、及びその記載事項は、前記「第2 〔理由〕3.引用例の認定」に記載したとおりである。



3.対比及び判断

本願発明は、上記「第2 〔理由〕2.本願補正発明の認定」の欄で認定した本願補正発明から、上記「第2 〔理由〕1.補正内容」の欄に記載した本件補正事項による限定を解除したものに相当する。

そうすると、本願発明の構成要件を全て含み、更に他の要件を付加したものに相当する本願補正発明が、前記「第2〔理由〕6.相違点に対する判断」に記載したとおり、引用例発明及び周知技術に基づいて、当業者が容易に発明することができたものであるから、
本願発明も、同様の理由により、引用例発明及び周知技術に基づいて当業者が容易に発明することができたものである。



4.むすび

したがって、本願発明は、引用例発明及び周知技術に基づいて、当業者が容易に発明をすることができたものであり、特許法第29条第2項の規定により特許を受けることができないから、他の請求項について検討するまでもなく、本願は拒絶されるべきものである。
 
審理終結日 2009-03-25 
結審通知日 2009-03-31 
審決日 2009-04-13 
出願番号 特願2006-313410(P2006-313410)
審決分類 P 1 8・ 121- Z (G06F)
最終処分 不成立  
前審関与審査官 上嶋 裕樹  
特許庁審判長 田口 英雄
特許庁審判官 手島 聖治
和田 財太
発明の名称 要約作成装置、データ処理方法およびデータ処理方法をコンピュータに実行させるためのプログラム  
代理人 橋本 公秀  
代理人 小栗 昌平  
代理人 市川 利光  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ