• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 5項独立特許用件 特許、登録しない。 G06F
審判 査定不服 4号2号請求項の限定的減縮 特許、登録しない。 G06F
審判 査定不服 特17条の2、3項新規事項追加の補正 特許、登録しない。 G06F
審判 査定不服 2項進歩性 特許、登録しない。 G06F
管理番号 1270962
審判番号 不服2010-20432  
総通号数 160 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2013-04-26 
種別 拒絶査定不服の審決 
審判請求日 2010-09-10 
確定日 2013-03-06 
事件の表示 特願2004-552977「意味的関連性に基づくコンテンツ抽出」拒絶査定不服審判事件〔平成16年 6月 3日国際公開、WO2004/046965、平成18年 2月23日国内公表、特表2006-506731〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 第1 手続の経緯

本願は、2003年11月7日(パリ条約による優先権主張外国庁受理2002年11月15日、米国)を国際出願日とする出願であって、平成17年5月13日に特許法第184条の5第1項に規定される書面が提出されるとともに、同日付けで特許法第184条の4第1項の規定による国際出願日における明細書、請求の範囲、図面(図面の中の説明に限る。)及び要約の翻訳文が提出され、平成18年11月6日付けで審査請求がなされ、平成21年7月21日付けで最初の拒絶理由通知(同年7月28日発送)がなされ、同年10月28日付けで意見書が提出されるとともに、同日付けで手続補正がなされ、同年12月15日付けで最後の拒絶理由通知(平成22年1月5日発送)がなされ、平成22年4月5日付けで意見書が提出されるとともに、同日付けで手続補正がなされたが、同年5月28日付けで前記平成22年4月5日付け手続補正を却下する旨の補正の却下の決定(同年6月8日発送)がなされるとともに、同日付けで拒絶査定(同年6月8日謄本送達)がなされ、これに対して、同年9月10日付けで審判請求がなされるとともに、同日付けで手続補正がなされたものである。
そして、平成22年11月2日付けで審査官により特許法第164条第3項に定める報告(前置報告)がなされ、平成24年2月13日付けで当審により特許法第134条第4項の規定に基づく審尋(同年2月21日発送)がなされたが、出願人からの応答がなかったものである。


第2 平成22年9月10日付けの手続補正についての補正却下の決定

[補正却下の決定の結論]

平成22年9月10日付けの手続補正を却下する。

[理由]

1.補正の内容

平成22年9月10日付けの手続補正(以下、「本件補正」という。)の内容は、平成21年10月28日付けの手続補正により補正された特許請求の範囲の請求項1ないし請求項15の記載

「 【請求項1】
音声メディアと視覚メディアとを有する複数のメディアモダリティのクエリを生成するためのクエリモジュールと、
複数のメディアモダリティを表すメディアデータを格納するためのデータベースと、
前記クエリから複数の第1オブジェクト特徴と前記データベースから複数の第2オブジェクト特徴を抽出するためのオブジェクト検出モジュールと、
前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴とを受信するため、前記オブジェクト検出モジュールに結合されるプロセッサと、
を有するマルチメディアシステムであって、
前記複数の第1及び第2オブジェクト特徴は、異なるモダリティを表すメディアデータから抽出され、
前記プロセッサは、前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定し、所定の最小の相関の大きさに少なくとも等しい相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出するよう構成される、
ことを特徴とするシステム。
【請求項2】
請求項1記載のマルチメディアシステムであって、
該システムは、抽出前にサンプルデータを用いてクロスモダリティメディアの間の相関の大きさを決定するようトレーニングされることを特徴とするシステム。
【請求項3】
請求項1記載のマルチメディアシステムであって、
前記相関の大きさは、正準相関法を利用して計算されることを特徴とするシステム。
【請求項4】
請求項1記載のマルチメディアシステムであって、
前記相関の大きさは、LSI(Latent Semantic Indexing)法を利用して計算されることを特徴とするシステム。
【請求項5】
請求項2記載のマルチメディアシステムであって、
前記トレーニングは、直交行列A=C_(xx)^(-1/2)UとB=C_(yy)^(-1/2)Vを生成し(ここで、det(A)=det(B)=1かつ
【数1】
C_(xx)=E{(X-m_(x))(X-m_(x))^(T)},
C_(yy)=E{(Y-m_(y))(Y-m_(y))^(T)},
C_(xy)=E{(X-m_(x))(Y-m_(y))^(T)},
K=C_(xx)^(-1/2)・C_(xy)・C_(yy)^(-1/2)=U・S・V^(T)である)、
第1モダリティの第1特徴集合を表すAXと第2モダリティの第2特徴集合を表すBYとの間の相関大きさは最大となり、これにより、前記第1モダリティから前記第2モダリティへの特徴の移転が可能となる(ここで、A及びBは直交行列であり、X及びYは異なるモダリティからの特徴集合であり、C_(xx)、C_(yy)及びC_(xy)は共分散行列であり、m_(x)及びm_(y)は平均ベクトルである)、
ことを特徴とするシステム。
【請求項6】
請求項5記載のマルチメディアシステムであって、
前記第1特徴集合を表すクエリであるAXは、前記第2特徴集合を表すクエリの結果であるBYしか与えられない場合も、BYはAXと最大の相関の大きさを有するため、特定可能であることを特徴とするシステム。
【請求項7】
音声メディアと視覚メディアとを有する複数のメディアモダリティのメディアデータを有するマルチメディアアーカイブからユーザが関心を有する少なくとも1つのアイテムを抽出する方法であって、
複数のメディアモダリティの1つのクエリを生成するステップと、
第1モダリティを表す複数の第1オブジェクト特徴を前記クエリから抽出するステップと、
第2モダリティを表す複数の第2オブジェクト特徴を前記マルチメディアアーカイブのアイテムから抽出するステップと、
前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定するステップと、
所定の最小の相関の大きさに少なくとも等しい、前記複数の第1オブジェクト特徴との相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記アーカイブから抽出するステップと、
を有することを特徴とする方法。
【請求項8】
請求項7記載の方法であって、さらに、
クロスモダリティメディアの間の相関の大きさを決定するのに用いられる相関行列を生成するため、サンプルデータを利用するステップを有することを特徴とする方法。
【請求項9】
請求項7記載の方法であって、
前記相関の大きさの決定方法は、正準相関であることを特徴とする方法。
【請求項10】
請求項7記載の方法であって、
前記相関の大きさの決定方法は、LSI(Latent Semantic Indexing)であることを特徴とする方法。
【請求項11】
請求項7記載の方法であって、
前記生成される行列は、直交行列A=C_(xx)^(-1/2)UとB=C_(yy)^(-1/2)Vにより表され(ここで、det(A)=det(B)=1かつ
【数2】
C_(xx)=E{(X-m_(x))(X-m_(x))^(T)},
C_(yy)=E{(Y-m_(y))(Y-m_(y))^(T)},
C_(xy)=E{(X-m_(x))(Y-m_(y))^(T)},
K=C_(xx)^(-1/2)・C_(xy)・C_(yy)^(-1/2)=U・S・V^(T)である)、
第1モダリティの第1特徴集合を表すAXと第2モダリティの第2特徴集合を表すBYとの間の相関の大きさは最大となり、これにより、前記第1モダリティから前記第2モダリティへの特徴の移転が可能となる(ここで、A及びBは直交行列であり、X及びYは異なるモダリティからの特徴集合であり、C_(xx)、C_(yy)及びC_(xy)は共分散行列であり、m_(x)及びm_(y)は平均ベクトルである)、、
ことを特徴とする方法。
【請求項12】
請求項11記載の方法であって、
前記第1特徴集合を表すクエリであるAXは、前記第2特徴集合を表すクエリの結果であるBYしか与えられない場合も、BYはAXと最大の相関の大きさを有するため、特定可能であることを特徴とする方法。
【請求項13】
ユーザによる音声メディアと視覚メディアとを有する複数のメディアモダリティのメディアデータを含むマルチメディアのデータベースからの関心のあるメディアの抽出を可能にするコンピュータ読み出し可能媒体に格納されているコンピュータ実行可能処理ステップであって、
前記マルチメディアのデータベースからメディアデータを抽出するため、前記ユーザから第1メディアモダリティのクエリを取得するクエリ生成ステップと、
前記クエリから複数の第1オブジェクト特徴を抽出する第1抽出ステップと、
マルチメディアアーカイブのメディアデータから第2メディアモダリティを表す複数の第2オブジェクト特徴を抽出する第2抽出ステップと、
前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定する相関計算ステップと、
所定の最小の相関の大きさに少なくとも等しい、前記複数の第1オブジェクト特徴との相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記アーカイブから抽出する抽出ステップと、
を有することを特徴とするステップ。
【請求項14】
音声メディアと視覚メディアとを有する複数のメディアモダリティのメディアデータを含むマルチメディアアーカイブからユーザに関心のある少なくとも1つのメディアデータを抽出する手段であって、
前記マルチメディアアーカイブからのメディアデータについて、第1メディアモダリティのクエリを生成する手段と、
前記クエリから複数の第1オブジェクト特徴を抽出する手段と、
前記マルチメディアアーカイブのアイテムから第2メディアモダリティを表す複数の第2オブジェクト特徴を抽出する手段と、
前記複数の第1オブジェクト特徴と第2メディアモダリティから抽出される前記複数の第2オブジェクト特徴との間の相関の大きさを決定する手段と、
所定の最小の相関の大きさに少なくとも等しい、前記複数の第1オブジェクト特徴との相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記マルチメディアアーカイブから抽出する手段と、
を有することを特徴とする手段。
【請求項15】
第1メディアモダリティのクエリを、第2メディアモダリティの前記クエリの結果しか初期的にわかっていないときに抽出する方法であって、
前記メディアモダリティは、音声メディアデータと視覚メディアデータとを有し、
当該方法は、
前記第2モダリティの特徴を前記第1モダリティに相関する特徴空間に変換するため、前記第1モダリティAのアイテムと前記第2モダリティのアイテムを相関させるためのトレーニング処理中に、A=C_(xx)^(-1/2)UとB=C_(yy)^(-1/2)Vとなり(ここで、det(A)=det(B)=1かつ
【数3】
C_(xx)=E{(X-m_(x))(X-m_(x))^(T)},
C_(yy)=E{(Y-m_(y))(Y-m_(y))^(T)},
C_(xy)=E{(X-m_(x))(Y-m_(y))^(T)},
K=C_(xx)^(-1/2)・C_(xy)・C_(yy)^(-1/2)=U・S・V^(T)となる)、前記第1モダリティの第1特徴集合を表すAXと前記第2モダリティの第2特徴集合を表すBYとの間の相関の大きさが最大となるように、格納されている行列Bを抽出するステップと、
前記第2モダリティのメディアデータからオブジェクト特徴を抽出するステップと、
前記第2モダリティに対するAYを計算するステップと、
マルチメディアデータベースに格納されている前記第1モダリティのメディアデータからオブジェクト特徴を抽出するステップと、
前記各メディアデータに対するAXを計算するステップと、
AXとAYを相関させるステップと、
AXとBYとの間の最大の相関の大きさを有するXを抽出するステップと、
を有することを特徴とする方法。」(以下、この特許請求の範囲に記載された請求項を「補正前の請求項」という。)

を、

「 【請求項1】
音声メディアと視覚メディアとを有する複数のメディアモダリティのクエリを生成するためのクエリモジュールと、
複数のメディアモダリティを表すメディアデータを格納するためのデータベースであって、各行列が前記メディアモダリティの1つに対応し、前記対応するメディアモダリティと他のメディアモダリティとの間の相関を構成する複数の行列を含むデータベースと、
前記クエリから複数の第1オブジェクト特徴と前記データベースから複数の第2オブジェクト特徴を抽出するためのオブジェクト検出モジュールと、
前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴とを受信するため、前記オブジェクト検出モジュールに結合されるプロセッサと、
を有するマルチメディアシステムであって、
前記複数の第1及び第2オブジェクト特徴は、異なるモダリティを表すメディアデータから抽出され、
前記プロセッサは、前記データベースの複数の行列上でサンプルデータを用いてクロスモダリティメディアの双方向の相関を最大化するようトレーニングされ、各行列を対応するメディアモダリティを表す格納されているメディアデータに適用し、対応する積の集合を構成し、
前記プロセッサは、前記複数の第1オブジェクト特徴に該複数の第1オブジェクト特徴のモダリティに対応するモダリティを有する前記複数の行列の行列を適用することによって、前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定し、クエリの積の集合を構成し、所定の最小の相関の大きさに少なくとも等しい前記クエリの積の集合との相関の大きさを有する対応する積の集合を有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出するよう構成される、
ことを特徴とするシステム。
【請求項2】
請求項1記載のマルチメディアシステムであって、
前記相関の大きさは、正準相関法を利用して計算されることを特徴とするシステム。
【請求項3】
請求項1記載のマルチメディアシステムであって、
前記相関の大きさは、LSI(Latent Semantic Indexing)法を利用して計算されることを特徴とするシステム。
【請求項4】
請求項1記載のマルチメディアシステムであって、
前記トレーニングは、直交行列A=C_(xx)^(-1/2)UとB=C_(xx)^(-1/2)Vを生成し(ここで、det(A)=det(B)=1かつ
【数1】
C_(xx)=E{(X-m_(x))(X-m_(x))^(T)},
C_(yy)=E{(Y-m_(y))(Y-m_(y))^(T)},
C_(xy)=E{(X-m_(x))(Y-m_(y))^(T)},
K=C_(xx)^(-1/2)・C_(xy)・C_(yy)^(-1/2)=U・S・V^(T)である)、
第1モダリティの第1特徴集合を表すAXと第2モダリティの第2特徴集合を表すBYとの間の相関大きさは最大となり、これにより、前記第1モダリティから前記第2モダリティへの特徴の移転が可能となる(ここで、A及びBは直交行列であり、X及びYは異なるモダリティからの特徴集合であり、C_(xx)、C_(yy)及びC_(xy)は共分散行列であり、m_(x)及びm_(y)は平均ベクトルである)、
ことを特徴とするシステム。
【請求項5】
音声メディアと視覚メディアとを有する複数のメディアモダリティのメディアデータを有するマルチメディアアーカイブであって、さらに各相関行列が前記メディアモダリティの1つに対応し、前記対応するメディアモダリティと他のメディアモダリティとの間の相関を構成する複数の相関行列を含むマルチメディアアーカイブからユーザが関心を有する少なくとも1つのアイテムを抽出する方法であって、
前記マルチメディアアーカイブの複数の相関行列上でサンプルデータを用いてクロスモダリティメディアの双方向の相関を最大化するようトレーニングし、各相関行列を対応するメディアモダリティを表す格納されているメディアデータに適用し、対応する積の集合を構成し、前記複数のメディアモダリティの1つのクエリを生成するステップと、
第1モダリティを表す複数の第1オブジェクト特徴を前記クエリから抽出し、前記第1モダリティに対応するモダリティを有する前記複数の相関行列の1つの相関行列を前記複数の第1オブジェクト特徴に適用し、クエリの積の集合を構成するステップと、
第2モダリティを表す積の集合を前記マルチメディアアーカイブから抽出するステップと、
前記クエリの積の集合と前記抽出された積の集合との間の相関の大きさを決定するステップと、
所定の最小の相関の大きさに少なくとも等しい、前記クエリの積の集合との相関の大きさを有する前記対応する積の集合を有する複数の第2オブジェクト特徴に対応するメディアデータを前記アーカイブから抽出するステップと、
を有することを特徴とする方法。
【請求項6】
請求項5記載の方法であって、さらに、
クロスモダリティメディアの間の相関の大きさを決定するのに用いられる前記相関行列を生成するため、サンプルデータを利用するステップを有することを特徴とする方法。
【請求項7】
請求項5記載の方法であって、
前記相関の大きさの決定方法は、正準相関であることを特徴とする方法。
【請求項8】
請求項5記載の方法であって、
前記相関の大きさの決定方法は、LSI(Latent Semantic Indexing)であることを特徴とする方法。
【請求項9】
請求項5記載の方法であって、
前記生成される行列は、直交行列A=C_(xx)^(-1/2)UとB=C_(xx)^(-1/2)Vにより表され(ここで、det(A)=det(B)=1かつ
【数2】
C_(xx)=E{(X-m_(x))(X-m_(x))^(T)},
C_(yy)=E{(Y-m_(y))(Y-m_(y))^(T)},
C_(xy)=E{(X-m_(x))(Y-m_(y))^(T)},
K=C_(xx)^(-1/2)・C_(xy)・C_(yy)^(-1/2)=U・S・V^(T)である)、
第1モダリティの第1特徴集合を表すAXと第2モダリティの第2特徴集合を表すBYとの間の相関の大きさは最大となり、これにより、前記第1モダリティから前記第2モダリティへの特徴の移転が可能となる(ここで、A及びBは直交行列であり、X及びYは異なるモダリティからの特徴集合であり、C_(xx)、C_(yy)及びC_(xy)は共分散行列であり、m_(x)及びm_(y)は平均ベクトルである)、
ことを特徴とする方法。
【請求項10】
プロセッサがユーザによる音声メディアと視覚メディアとを有する複数のメディアモダリティのメディアデータを含むマルチメディアのデータベースから対象メディアを抽出することを可能にするコンピュータ実行可能処理ステップを格納するコンピュータ読み出し可能媒体であって、
前記データベースはさらに、各行列が前記メディアモダリティの1つに対応し、前記対応するメディアモダリティと他のメディアモダリティとの間の相関を構成する複数の行列を有し、
前記コンピュータ実行可能処理ステップは、
前記マルチメディアのデータベースからメディアデータを抽出するため、ユーザから第1メディアモダリティのクエリを取得するクエリ生成ステップと、
前記クエリから複数の第1オブジェクト特徴を抽出し、対応するモダリティを有する前記複数の行列の1つを前記複数の第1オブジェクト特徴に適用し、クエリの積の集合を構成する第1抽出ステップと、
マルチメディアアーカイブのメディアデータから第2メディアモダリティを表す複数の第2オブジェクト特徴を抽出し、対応するモダリティを有する前記複数の行列の1つを前記複数の第2オブジェクト特徴に適用し、第2の積の集合を構成する第2抽出ステップと、
前記クエリの積の集合と前記第2の積の集合との間の相関の大きさを決定する相関計算ステップと、
所定の最小の相関の大きさに少なくとも等しい、前記クエリの積の集合との相関の大きさを有する前記第2の積の集合に対応するメディアデータを前記データベースから抽出する抽出ステップと、
を有することを特徴とするステップ。
【請求項11】
音声メディアと視覚メディアとを有する複数のメディアモダリティのメディアデータを含むマルチメディアアーカイブからユーザに関心のある少なくとも1つのメディアデータを抽出する手段であって、
前記マルチメディアアーカイブはさらに、各相関行列が前記複数のメディアモダリティの1つに対応し、前記対応するメディアモダリティと他のメディアモダリティとの間の相関を構成する複数の相関行列を有し、
当該抽出する手段は、
前記マルチメディアアーカイブからのメディアデータについて、第1メディアモダリティのクエリを生成する手段と、
前記クエリから複数の第1オブジェクト特徴を抽出し、対応するモダリティを有する前記複数の相関行列の1つを前記複数の第1オブジェクト特徴に適用し、クエリの積の集合を構成する手段と、
前記マルチメディアアーカイブのアイテムから第2メディアモダリティを表す複数の第2オブジェクト特徴を抽出し、前記第2メディアモダリティを有する前記複数の相関行列の1つを前記複数の第2オブジェクト特徴に適用し、第2の積の集合を構成する手段と、
前記クエリの積の集合と前記第2の積の集合との間の相関の大きさを決定する手段と、
所定の最小の相関の大きさに少なくとも等しい、前記クエリの積の集合との相関の大きさを有する前記第2の積の集合に対応するメディアデータを前記マルチメディアアーカイブから抽出する手段と、
を有することを特徴とする手段。
【請求項12】
第1メディアモダリティのクエリを、第2メディアモダリティの前記クエリの結果しか初期的にわかっていないときに抽出する方法であって、
前記メディアモダリティは、音声メディアデータと視覚メディアデータとを有し、
当該方法は、
前記第2モダリティの特徴を前記第1モダリティに相関する特徴空間に変換するため、前記第1モダリティAのアイテムと前記第2モダリティのアイテムを相関させるためのトレーニング処理中に、A=C_(xx)^(-1/2)UとB=C_(xx)^(-1/2)Vとなり(ここで、det(A)=det(B)=1かつ
【数3】
C_(xx)=E{(X-m_(x))(X-m_(x))^(T)},
C_(yy)=E{(Y-m_(y))(Y-m_(y))^(T)},
C_(xy)=E{(X-m_(x))(Y-m_(y))^(T)},
K=C_(xx)^(-1/2)・C_(xy)・C_(yy)^(-1/2)=U・S・V^(T)となる)、前記第1モダリティの第1特徴集合を表すAXと前記第2モダリティの第2特徴集合を表すBYとの間の相関の大きさが最大となるように、格納されている行列Bを抽出するステップと、
前記第2モダリティのメディアデータからオブジェクト特徴を抽出するステップと、
前記第2モダリティのメディアデータに対するBYを計算するステップと、
マルチメディアデータベースに格納されている前記第1モダリティのメディアデータからオブジェクト特徴を抽出するステップと、
前記第1モダリティの各メディアデータに対するAXを計算するステップと、
AXとBYを相関させるステップと、
BYと最大の相関を有するAXにより表されるXのメディアデータを抽出するステップと、
を有することを特徴とする方法。」(以下、この特許請求の範囲に記載された請求項を「補正後の請求項」という。)

に補正することを含むものである。

2.新規事項の有無、補正の目的要件

2-1.特許法第17条の2第3項に規定する要件についての検討

本件補正が、特許法第17条の2第3項の規定を満たすものであるか否か、即ち、本件補正が願書に最初に添付された明細書、請求の範囲及び図面(以下、これを「当初明細書等」という。)の範囲内でなされたものであるかについて、以下に検討する。

(1)補正後の請求項4、9、12について

本件補正は、補正前の請求項5、11、15に記載された

「直行行列A=C_(xx)^(-1/2)UとB=C_(yy)^(-1/2)Vを生成」

を、それぞれ、補正後の請求項4、9、12に記載された

「直行行列A=C_(xx)^(-1/2)UとB=C_(xx)^(-1/2)Vを生成」

に補正することを含むものである。
(当審注:下線は、参考のために当審で付与したものである。以下同じ。)

しかしながら、発明の詳細な説明の第【0033】段落の記載を参照すると、直交行列A、Bについて、

「A=C_(xx)^(-1/2)UとB=C_(yy)^(-1/2)Vが求められる」

と記載されているように、直行行列Bについて、「B=C_(xx)^(-1/2)V」なる記載はされておらず、また、発明の詳細な説明又は図面から自明の事項ということはできない。

以上のように、補正後の請求項4、9、12に記載された前記「B=C_(xx)^(-1/2)V」は、出願当初の明細書、特許請求の範囲又は図面に記載されておらず、かつ、その記載から自明なものでもないから、当該事項を追加する本件補正は、出願当初の明細書又は図面に記載した範囲内でしたものではない。

(2)補正後の請求項5について

本件補正は、補正前の請求項7に記載された

「第2モダリティを表す複数の第2オブジェクト特徴を前記マルチメディアアーカイブのアイテムから抽出するステップ」

を、補正後の請求項5に記載された

「第2モダリティを表す積の集合を前記マルチメディアアーカイブから抽出するステップ」

に補正することを含むものである。

しかしながら、出願当初の明細書を参照すると、

「【0030】
図3と3aは、本発明の動作を示す。図3において、映像140は、図2の映像インタフェース124を介し図2のCPU120に入力される。映像140は、音声と視覚要素である視覚142と音声144に分離される。画像特徴抽出ステップ146により、視覚142から視覚的特徴が抽出され、音声特徴抽出ステップ148により、音声144から音声的特徴が抽出される。このプロセスは、M.Li、D.Li及びN.Dimitrovaの発明による2002年2月14日に出願された米国特許出願第10/076,194号「Speaking Face Detection in TV Domain」の10?11ページに十分に記載されている。」、
「【0038】
図3aに戻って、ステップ158において、A及びB行列が格納される。ステップ160において、映像(X)と音声(Y)を用いたクエリが、マルチメディアデータベースに対し初期化される。ステップ162において、A及びB行列がXとYを関連付けるのに用いられる。モダリティXからのクエリがあるとき、抽出されたXの特徴を利用してAXを計算することができる。その後、モダリティBに対するデータベースのすべてのアイテムに対して、BYを計算することができる。モダリティYからのクエリがあるとき、Yの抽出された特徴を利用して、BYを計算することができる。その後、モダリティAに対するデータベースのすべてのアイテムに対して、AXを計算することができる。」、

と記載されているように、モダリティX及びモダリティYが抽出される態様が記載されているにすぎず、(また、「A及びB行列が格納」との記載から、モダリティA及びモダリティBが抽出されることも否定できないが、)「第2モダリティを表す積の集合」を「マルチメディアアーカイブから抽出」される態様までは記載されているとは認められず、また、発明の詳細な説明又は図面から自明の事項ということはできない。

以上のように、補正後の請求項5に記載された前記「第2モダリティを表す積の集合を前記マルチメディアアーカイブから抽出するステップ」は、出願当初の明細書、特許請求の範囲又は図面に記載されておらず、かつ、その記載から自明なものでもないから、当該事項を追加する本件補正は、出願当初の明細書又は図面に記載した範囲内でしたものではない。

(3)小括

したがって、本件補正は、特許法第17条の2第3項の規定に違反するので、同法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。

2-2.特許法第17条の2第4項に規定する要件についての検討

次に、本件補正が、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法17条の2第4項の規定を満たすものであるか否か、すなわち、本件補正が、特許法第17条の2第4項に規定する請求項の削除、特許請求の範囲の減縮(特許法第36条第5項の規定により請求項に記載した発明を特定するために必要な事項を限定するものであって、その補正前の当該請求項に記載された発明とその補正後の当該請求項に記載される発明の産業上の利用分野及び解決しようとする課題が同一であるものに限る)、誤記の訂正、或いは、明りょうでない記載の釈明(拒絶理由通知に係る拒絶の理由に示す事項についてするものに限る)の何れかを目的としたものであるかについて、以下に検討する。

本件補正は、補正前の請求項7に記載された

「複数のメディアモダリティの1つのクエリを生成するステップ」

を、補正後の請求項5に記載された

「前記マルチメディアアーカイブの複数の相関行列上でサンプルデータを用いてクロスモダリティメディアの双方向の相関を最大化するようトレーニングし、各相関行列を対応するメディアモダリティを表す格納されているメディアデータに適用し、対応する積の集合を構成し、前記複数のメディアモダリティの1つのクエリを生成するステップ」

に補正することを含むものである。

しかしながら、前記「前記マルチメディアアーカイブの複数の相関行列上でサンプルデータを用いてクロスモダリティメディアの双方向の相関を最大化するようトレーニングし、各相関行列を対応するメディアモダリティを表す格納されているメディアデータに適用し、対応する積の集合を構成」することは、補正前の請求項7における方法が備えるステップ

すなわち、
「複数のメディアモダリティの1つのクエリを生成するステップ」、
「第1モダリティを表す複数の第1オブジェクト特徴を前記クエリから抽出するステップ」、
「第2モダリティを表す複数の第2オブジェクト特徴を前記マルチメディアアーカイブのアイテムから抽出するステップ」、
「前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定するステップ」、
「所定の最小の相関の大きさに少なくとも等しい、前記複数の第1オブジェクト特徴との相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記アーカイブから抽出するステップ」、

のいずれかのステップを限定した下位概念の補正ではなく、新たな構成を追加した補正であるものと認められる。

したがって、本件補正は、補正前の請求項7に記載した発明を特定するために必要な事項を限定したものではなく、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第4項第2号の特許請求の範囲の減縮(請求項に記載した発明を特定するために必要な事項を限定するものであって、その補正前の当該請求項に記載された発明とその補正後の請求項に記載された発明の産業上の利用分野及び解決しようとする課題が同一であるもの)を目的とするものとは認められない。

なお、前記補正前の請求項7についてする補正は、特許法第17条の2第4項第1号の請求項の削除、第3号の誤記の訂正、第4号の明瞭でない記載の釈明(拒絶理由通知に係る拒絶の理由に示す事項についてするものに限る。)に該当するものではないことは明らかである。

以上のとおり、本件補正は、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第4項の規定に違反するものであり、したがって、前記補正前の請求項7についてする補正を含む本件補正は、特許法第159条第1項で読み替えて準用する同法第53条第1項の規定により却下されるべきものである

3.独立特許要件

以上のように、補正前の請求項5、7、11、15についてする補正は、「2-1.特許法第17条の2第3項に規定する要件についての検討 」で指摘したとおり、当初明細書の範囲内でしたものではないので、(翻訳文等に記載した範囲内でしたものではないので、外国語特許出願に係る明細書、特許請求の範囲又は図面について補正ができる範囲の特例について規定した特許法第184条の12第2項に基づき、平成14年法律第24号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の)特許法第17条の2第3項の規定に違反し、また、補正前の請求項7についてする補正は、「2-2.特許法第17条の2第4項に規定する要件についての検討 」で指摘したとおり、特許法第17条の2第4項第2号の限定的減縮に該当せず、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第4項の規定に違反するものであるが、仮に、本件補正が、翻訳文等に記載した範囲内でしたものであると仮定し、かつ、特許法第17条の2第4項第2号の限定的減縮に該当すると仮定した場合に、本件補正後の請求項に記載された発明が特許出願の際独立して特許を受けることができるものであるか(平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第5項において準用する同法第126条第5項の規定に適合するか)検討する。

3-1.特許法第36条に規定する要件についての検討

(1)補正後の請求項1について

(1-1)補正後の請求項1に記載された「前記複数の行列の行列」の意味が明らかでなく、例えば、「複数の行列」のうちの「1つの行列」とも、「複数の行列」から構成される新たな「行列」とも解釈でき、特定することができない。

したがって、補正後の請求項1に係る発明は、明確でない。(第36条第6項第2号)

(1-2)補正後の請求項1に記載された「前記プロセッサは、前記複数の第1オブジェクト特徴に該複数の第1オブジェクト特徴のモダリティに対応するモダリティを有する前記複数の行列の行列を適用することによって」の係り先が明らかでなく、「前記複数の第1オブジェクト特徴に該複数の第1オブジェクト特徴のモダリティに対応するモダリティを有する前記複数の行列の行列を適用すること」が、これに続く「前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定」すること、「クエリの積の集合を構成」すること、「所定の最小の相関の大きさに少なくとも等しい前記クエリの積の集合との相関の大きさを有する対応する積の集合を有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出する」ことのいずれに関係するのか、明らかでない。

したがって、補正後の請求項1に係る発明は、明確でない。(第36条第6項第2号)

(1-3)補正後の請求項1に記載された「前記複数の第1オブジェクト特徴に該複数の第1オブジェクト特徴のモダリティに対応するモダリティを有する前記複数の行列の行列を適用すること」が、具体的にどのような処理を行うのか明確でなく、「クエリの積の集合を構成」することとの処理の違いが明らかでない。

したがって、補正後の請求項1に係る発明は、明確でない。(第36条第6項第2号)

(2)補正後の請求項2ないし補正後の請求項4について

補正後の請求項2ないし補正後の請求項4は、補正後の請求項1を、直接引用するものであるから、上記(1)で指摘の、補正後の請求項1に係る発明における不明な構成を内包し、かつ、補正後の請求項2ないし補正後の請求項4に記載の内容を加味しても、上記(1)で指摘の不明な構成が明確になるものではない。

したがって、補正後の請求項2ないし補正後の請求項4に係る発明は、明確でない。(第36条第6項第2号)

(3)補正後の請求項4、9、12について

補正後の請求項4、9、12には、直行行列について、

「直行行列A=C_(xx)^(-1/2)UとB=C_(xx)^(-1/2)Vを生成」

と記載されているが、発明の詳細な説明の第【0033】段落の記載を参照すると、直交行列A、Bについて、

「A=C_(xx)^(-1/2)UとB=C_(yy)^(-1/2)Vが求められる」

と記載されており、補正後の請求項4、9、12の記載は、発明の詳細な説明に記載された実施例と相違する。

したがって、補正後の請求項4、9、12に係る発明は、発明の詳細な説明に記載したものでない。(第36条第6項第1号)

(4)補正後の請求項5について

補正後の請求項5に係る「前記マルチメディアアーカイブの複数の相関行列上でサンプルデータを用いてクロスモダリティメディアの双方向の相関を最大化するようトレーニングし、各相関行列を対応するメディアモダリティを表す格納されているメディアデータに適用し、対応する積の集合を構成し、前記複数のメディアモダリティの1つのクエリを生成するステップ」は、「前記マルチメディアアーカイブの複数の相関行列上でサンプルデータを用いてクロスモダリティメディアの双方向の相関を最大化するようトレーニングし、各相関行列を対応するメディアモダリティを表す格納されているメディアデータに適用し、対応する積の集合を構成」することがどのように「前記複数のメディアモダリティの1つのクエリを生成する」ことと関係するのか明らかでない。
また、「対応する積の集合を構成する」ことに対応する具体的な情報処理が明らかでない。

したがって、補正後の請求項5に係る発明は、明確でない。(第36条第6項第2号)

(5)補正後の請求項6ないし補正後の請求項9について

補正後の請求項6ないし補正後の請求項9は、補正後の請求項5を、直接引用するものであるから、上記(4)で指摘の、補正後の請求項5に係る発明における不明な構成を内包し、かつ、補正後の請求項6ないし補正後の請求項9に記載の内容を加味しても、上記(4)で指摘の不明な構成が明確になるものではない。

したがって、補正後の請求項6ないし補正後の請求項9に係る発明は、明確でない。(第36条第6項第2号)

3-2.まとめ

以上のように、本件補正後の請求項1ないし補正後の請求項9、及び補正後の請求項12に記載された発明は、特許法第36条第6項第1号及び第2号に規定にする要件を満たしていないため、特許出願の際独立して特許を受けることができるものではないから、本件補正は、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第5項の規定により準用する特許法第126条第5項の規定に違反するので、特許法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。

4.むすび

以上のとおり、本件補正は、上記「2-1.特許法第17条の2第3項に規定する要件についての検討 」で指摘したとおり、翻訳文等に記載した範囲内でしたものではないので、外国語特許出願に係る明細書、特許請求の範囲又は図面について補正ができる範囲の特例について規定した特許法第184条の12第2項に基づき、平成14年法律第24号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第3項の規定に違反するので、同法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。

また、仮に、本件補正が、翻訳文等に記載した範囲内においてなされたものであると仮定した場合であっても、本件補正は、上記「2-2.特許法第17条の2第4項に規定する要件についての検討 」で指摘したとおり、補正前の請求項7についてする補正を含む本件補正は、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第4項の規定に違反するので、特許法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。

そして、仮に、本件補正が、翻訳文等に記載した範囲内にしたものであると仮定し、かつ、特許法第17条の2第4項第2号の限定的減縮に該当すると仮定した場合であっても、本件補正は、上記「3.独立特許要件」で指摘したとおり、補正後の請求項1ないし補正後の請求項9、及び補正後の請求項12に記載された発明は、特許出願の際独立して特許を受けることができるものではないから、本件補正は、平成18年法律第55号改正附則第3条第1項によりなお従前の例によるとされる同法による改正前の特許法第17条の2第5項の規定により準用する特許法第126条第5項の規定に違反するので、特許法第159条第1項において読み替えて準用する同法第53条第1項の規定により却下すべきものである。

よって、補正却下の決定の結論のとおり決定する。


第3 本願発明について

1.本願発明

平成22年9月10日付けの手続補正は上記のとおり却下されたので、本願の請求項1に係る発明(以下、「本願発明」という。)は、平成21年10月28日付け手続補正書の特許請求の範囲の請求項1に記載された事項により特定される、以下のとおりのものである。
(当審注:下線は、参考のために当審で付与したものである。)

「音声メディアと視覚メディアとを有する複数のメディアモダリティのクエリを生成するためのクエリモジュールと、
複数のメディアモダリティを表すメディアデータを格納するためのデータベースと、
前記クエリから複数の第1オブジェクト特徴と前記データベースから複数の第2オブジェクト特徴を抽出するためのオブジェクト検出モジュールと、
前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴とを受信するため、前記オブジェクト検出モジュールに結合されるプロセッサと、
を有するマルチメディアシステムであって、
前記複数の第1及び第2オブジェクト特徴は、異なるモダリティを表すメディアデータから抽出され、
前記プロセッサは、前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定し、所定の最大の相関の大きさに少なくとも等しい相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出するよう構成される、
ことを特徴とするシステム。」

なお、前記請求項1に記載された「前記プロセッサは、前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定し、所定の最小の相関の大きさに少なくとも等しい相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出するよう構成される」における、「所定の最小の相関の大きさ」については、「所定の最大の相関の大きさ」の誤記であると認定した。

2.引用文献に記載されている技術的事項及び引用発明の認定

本願の出願前に頒布され、原審の拒絶の査定の理由である上記平成21年12月15日付けの拒絶理由通知において引用された、特開2001-184357号公報(平成13年7月6日出願公開。以下、「引用文献」という。)には、図面とともに、以下の技術的事項が記載されている。
(当審注:下線は、参考のために当審で付与したものである。)

A 「【請求項1】検索対象である第1の種類のマルチメディア素材とは種類の異なる第2の種類に属するマルチメディア素材を検索キーとして入力する検索キー入力手段と、
前記検索キーから、前記第2の種類に属するマルチメディア素材に特有の特徴を抽出し、その抽出した特徴を、マルチメディア素材の種類に依存しない共通の特徴記述に変換する特徴抽出手段と、
前記共通の特徴記述を、検索対象である前記第1の種類のマルチメディア素材に特有の特徴記述に再変換し、この再変換された特徴記述と、検索対象である前記第1の種類の各マルチメディア素材が記憶されているデータベースから抽出した前記第1の種類の各マルチメディア素材の特徴記述とを比較し、両者の類似度に基づいて検索解を出力する検索手段と、を設けたことを特徴とするマルチメディア素材検索装置。」

B 「【0001】
【発明の属する技術分野】本発明は、マルチメディア素材のデータベースの検索において、検索対象のマルチメディア素材とは種類の異なるマルチメディア素材を検索キーとして検索を行う検索装置に関するものである。」

C 「【0008】次に、本発明の第1の実施例について説明する。第1の実施例は、検索キーとしてビデオのシーンを入力し、それに類似する楽曲データを検索する装置である。本発明の第1の実施例の構成を図1に示す。」

D 「【0014】ビデオ特徴抽出手段21において、ビデオシーンのビデオに特有の特徴が抽出される(ステップS2)。ここで抽出される特徴としては、色のヒストグラム、動きの激しさ、ビデオ中の物体の移動の軌跡などの統計的な特徴や、ビデオに付加されたキーワードやビデオ中の物体に付加されたキーワードなどの意味的な特徴などが考えられる。」

(ア)上記Aの記載からすると、引用文献には、
検索対象である第1の種類のマルチメディア素材とは種類の異なる第2の種類に属するマルチメディア素材を検索キーとして入力する検索キー入力手段
が記載されている。

(イ)上記Aの記載からすると、引用文献には、
各マルチメディア素材が記憶されているデータベース
が記載されている。

(ウ)上記Aの「前記検索キーから、前記第2の種類に属するマルチメディア素材に特有の特徴を抽出し、その抽出した特徴を、マルチメディア素材の種類に依存しない共通の特徴記述に変換する特徴抽出手段」、「検索対象である前記第1の種類の各マルチメディア素材が記憶されているデータベースから抽出した前記第1の種類の各マルチメディア素材の特徴記述」との記載からすると、引用文献には、
検索キーから第2の種類に属するマルチメディア素材に特有の特徴とデータベースから第1の種類に属するマルチメディア素材に特有の特徴を抽出する特徴抽出手段
が記載されている。

(エ)上記Aの記載からすると、引用文献には、
検索キー入力手段、データベース、特徴抽出手段を有するマルチメディア素材検索装置
が記載されている。

(オ)上記Aの「検索対象である第1の種類のマルチメディア素材とは種類の異なる第2の種類に属するマルチメディア素材を検索キーとして入力」、「前記検索キーから、前記第2の種類に属するマルチメディア素材に特有の特徴を抽出」、「検索対象である前記第1の種類の各マルチメディア素材が記憶されているデータベースから抽出した前記第1の種類の各マルチメディア素材の特徴記述」との記載からすると、引用文献には、
第1の種類に属するマルチメディア素材の特徴及び第2の種類に属するマルチメディア素材の特徴は、種類の異なるマルチメディア素材から抽出される
態様が記載されている。

(カ)上記Aの「前記検索キーから、前記第2の種類に属するマルチメディア素材に特有の特徴を抽出し、その抽出した特徴を、マルチメディア素材の種類に依存しない共通の特徴記述に変換」、「前記共通の特徴記述を、検索対象である前記第1の種類のマルチメディア素材に特有の特徴記述に再変換」、「再変換された特徴記述と、検索対象である前記第1の種類の各マルチメディア素材が記憶されているデータベースから抽出した前記第1の種類の各マルチメディア素材の特徴記述とを比較し、両者の類似度に基づいて検索解を出力」との記載からすると、第2の種類に属するマルチメディア素材の特徴は、共通の特徴記述を経由して、第1の種類に属するマルチメディア素材の特徴と比較されている。そして、上記Bの「本発明は、マルチメディア素材のデータベースの検索において、検索対象のマルチメディア素材とは種類の異なるマルチメディア素材を検索キーとして検索を行う検索装置」との記載からすると、引用文献に記載されているものは、データベースを検索した結果を出力するものである。してみると、引用文献には、
第1の種類に属するマルチメディア素材の特徴と第2の種類に属するマルチメディア素材の特徴とを比較し、両者の類似度に基づいてデータベースから抽出された検索解を出力する
態様が記載されている。

以上、(ア)ないし(カ)で指摘した事項から、引用文献には、次の発明(以下、「引用発明」という。)が記載されているものと認める。

検索対象である第1の種類のマルチメディア素材とは種類の異なる第2の種類に属するマルチメディア素材を検索キーとして入力する検索キー入力手段と、
前記各マルチメディア素材が記憶されているデータベースと、
前記検索キーから前記第2の種類に属するマルチメディア素材に特有の特徴と前記データベースから前記第1の種類に属するマルチメディア素材に特有の特徴を抽出する特徴抽出手段と、
を有するマルチメディア素材検索装置であって、
前記第1の種類に属するマルチメディア素材の特徴及び前記第2の種類に属するマルチメディア素材の特徴は、種類の異なるマルチメディア素材から抽出され、
前記第1の種類に属するマルチメディア素材の特徴と前記第2の種類に属するマルチメディア素材の特徴とを比較し、両者の類似度に基づいてデータベースから抽出された検索解を出力するよう構成される、
マルチメディア素材検索装置。

3.対比

本願発明と引用発明とを対比する。

(1)引用発明の「検索キー」は、本願発明の「クエリ」に相当する。また、引用発明の「検索キーとして入力する検索キー入力手段」は、マルチメディア素材検索装置に与える検索キーを生成しているといえるから、本願発明の「クエリを生成するためのクエリモジュール」に相当するといえる。
ここで、上記Cの「第1の実施例は、検索キーとしてビデオのシーンを入力し、それに類似する楽曲データを検索する」との記載からすると、引用発明の「マルチメディア素材」の具体例として、実施例には、「ビデオシーン」(本願発明の「視覚メディア」に相当)や「楽曲データ」(本願発明の「音声メディア」に相当)が記載されている。そして、これら「ビデオシーン」や「楽曲データ」は、「メディアモダリティ」といえるものである。
してみると、引用発明の「検索対象である第1の種類のマルチメディア素材とは種類の異なる第2の種類に属するマルチメディア素材を検索キーとして入力する検索キー入力手段」は、本願発明の「音声メディアと視覚メディアとを有する複数のメディアモダリティのクエリを生成するためのクエリモジュール」に相当するといえる。

(2)引用発明の「マルチメディア素材」及び「記憶」は、それぞれ、本願発明の「メディアデータ」及び「格納」に相当する。そして、引用発明の「マルチメディア素材」は、メディアモダリティを表すものであるといえる。また、データベースに複数のデータが記憶されることは、当業者にとって自明の事項である。
したがって、引用発明の「前記各マルチメディア素材が記憶されているデータベース」は、本願発明の「複数のメディアモダリティを表すメディアデータを格納するためのデータベース」に相当するといえる。

(3)引用発明の「第2の種類に属するマルチメディア素材に特有の特徴」、「第1の種類に属するマルチメディア素材に特有の特徴」、及び「特徴抽出手段」は、それぞれ、本願発明の「第1オブジェクト特徴」、「第2オブジェクト特徴」、及び「オブジェクト検出モジュール」に相当する。また、上記Dの「ここで抽出される特徴としては、色のヒストグラム、動きの激しさ、ビデオ中の物体の移動の軌跡などの統計的な特徴や、ビデオに付加されたキーワードやビデオ中の物体に付加されたキーワードなどの意味的な特徴などが考えられる。」との記載からすると、特徴の抽出に際しては、複数の特徴が抽出されるものと認められる。
したがって、引用発明の「前記検索キーから前記第2の種類に属するマルチメディア素材に特有の特徴と前記データベースから前記第1の種類に属するマルチメディア素材に特有の特徴を抽出する特徴抽出手段」は、本願発明の「前記クエリから複数の第1オブジェクト特徴と前記データベースから複数の第2オブジェクト特徴を抽出するためのオブジェクト検出モジュール」に相当する。

(4)引用発明の「マルチメディア素材検索装置」においても、抽出、検索等の処理を行う何らかのプロセッサを有していることは、当業者にとって自明な事項である。してみると、引用発明においても、
第2の種類に属するマルチメディア素材に特有の特徴と第1の種類に属するマルチメディア素材に特有の特徴とを受信するため、特徴抽出手段に結合されるプロセッサを有していること、すなわち、本願発明の「前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴とを受信するため、前記オブジェクト検出モジュールに結合されるプロセッサ」に相当するものを有しているといえる。

(5)引用発明の「マルチメディア素材検索装置」は、上記Bに記載されるように、検索対象のマルチメディア素材とは種類の異なるマルチメディア素材を検索キーとしてマルチメディア素材の検索を行う
ものであることから、本願発明の「マルチメディアシステム」に相当する。

(6)引用発明の「種類の異なるマルチメディア素材」は、本願発明の「異なるモダリティを表すメディアデータ」に相当する。
したがって、引用発明の「前記第1の種類に属するマルチメディア素材の特徴及び前記第2の種類に属するマルチメディア素材の特徴は、種類の異なるマルチメディア素材から抽出され」は、本願発明の「前記複数の第1及び第2オブジェクト特徴は、異なるモダリティを表すメディアデータから抽出され」に相当するといえる。

(7)引用発明の「類似度」は、本願発明の「相関度」に相当する。
ここで、引用発明の「前記第1の種類に属するマルチメディア素材の特徴と前記第2の種類に属するマルチメディア素材の特徴とを比較し、両者の類似度に基づいてデータベースから抽出された検索解を出力する」とは、第1の種類に属するマルチメディア素材の特徴と第2の種類に属するマルチメディア素材の特徴とを比較し、データベースから相関度の大きい検索解を抽出するものであるといえる。そして、本願発明の「前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定し、所定の最大の相関の大きさに少なくとも等しい相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出する」とは、第1オブジェクト特徴と第2オブジェクト特徴とを比較し、データベースから相関度の大きいメディアデータを抽出することに他ならない。
してみると、引用発明の「前記第1の種類に属するマルチメディア素材の特徴と前記第2の種類に属するマルチメディア素材の特徴とを比較し、両者の類似度に基づいてデータベースから抽出された検索解を出力する」と、本願発明の「前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定し、所定の最大の相関の大きさに少なくとも等しい相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出する」とは、ともに、“前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴とを比較し、データベースから相関度の大きいメディアデータを抽出する”である点で共通するといえる。

以上から、本願発明と引用発明とは、以下の点で一致し、また、以下の点で相違する。

(一致点)

音声メディアと視覚メディアとを有する複数のメディアモダリティのクエリを生成するためのクエリモジュールと、
複数のメディアモダリティを表すメディアデータを格納するためのデータベースと、
前記クエリから複数の第1オブジェクト特徴と前記データベースから複数の第2オブジェクト特徴を抽出するためのオブジェクト検出モジュールと、
前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴とを受信するため、前記オブジェクト検出モジュールに結合されるプロセッサと、
を有するマルチメディアシステムであって、
前記複数の第1及び第2オブジェクト特徴は、異なるモダリティを表すメディアデータから抽出され、
前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴とを比較し、データベースから相関度の大きいメディアデータを抽出するよう構成される、
ことを特徴とするシステム。

(相違点)

第1オブジェクト特徴と第2オブジェクト特徴とを比較し、データベースから相関度の大きいメディアデータを抽出する際に、本願発明は、「前記複数の第1オブジェクト特徴と前記複数の第2オブジェクト特徴との間の相関の大きさを決定し、所定の最大の相関の大きさに少なくとも等しい相関の大きさを有する前記複数の第2オブジェクト特徴に対応するメディアデータを前記データベースから抽出する」ものであるのに対して、引用発明は、「前記第1の種類に属するマルチメディア素材の特徴と前記第2の種類に属するマルチメディア素材の特徴とを比較し、両者の類似度に基づいてデータベースから抽出された検索解を出力する」ものである点。
(すなわち、本願発明は、正準相関法のようなものを利用して相関度の大きいマルチメディアデータを抽出するものであるのに対して、引用発明は、どのような方法で抽出するのか具体的に記載されていない点。)

4.当審の判断

上記相違点について検討する。

当該技術分野において、二組の変数群に対して相互の変数群の関連(相関)を最大にするような重み係数を得ることは、正準相関分析法を始めとして本願出願時において周知の技術である。(必要であれば、原審の拒絶の査定の理由である上記平成21年12月15日付けの拒絶理由通知において引用された、“柳井 晴夫、高木 廣文 編、多変量解析ハンドブック、株式会社現代数学社、1986年04月20日、第1版、p.98?117”(特に、p.98?102)等参照。)

してみると、引用発明においても、第1の種類に属するマルチメディア素材の特徴と第2の種類に属するマルチメディア素材の特徴とを比較する際に、当該周知技術を採用し、上記相違点に係る構成とすることは、当業者が容易に想到しうるものである。

よって、相違点は格別なものではない。

そして、当該相違点を総合的に勘案しても、本願発明の奏する作用効果は、上記引用発明及び周知技術の奏する作用効果から予測される範囲内のものにすぎず、格別顕著なものということはできない。

したがって、本願発明は、上記引用発明及び周知技術に基づいて、当業者が容易に発明をすることができたものである。

5.審判請求書における請求人の主張について

なお、請求人は、上記平成22年9月10日付けで提出された審判請求書において、本件補正により補正された特許請求の範囲の請求項1に係る発明(以下、「請求人が主張する本願発明」という。)と引用文献1とを比較し、下記の主張を行っている。

「引用文献1(特開2001-184357号公報)によると、クエリ抽出された各特徴について2つの計算を実行することが必要であります。すなわち、まずビデオシーンの抽出された特徴が共通の特徴記述に変換され、その後に変換された特徴記述が再び音楽に固有の特徴記述に再変換されます。
他方、本願発明は、クエリ抽出された特徴に対して、1つの計算(変換)しか実行されていません。対応する計算(変換)がデータベースにすでに格納されているメディアデータの特徴に対して実行される間、これは“オフライン”となる可能性があります。この結果、クエリの起動時により迅速な実行を可能にし、かなり少ない処理パワーしか必要としないという引用文献1及び2の何れにも記載されていない有利な効果を奏することが可能となります。」

しかしながら、2つの異なるメディアの特徴量間の相関関係を統計的手法により直接求めることは、当該技術分野において、周知事項にすぎず(必要であれば、“FISHER III, J.W., et al., Learning Joint Statistical Models for Audio-Visual Fusion and Segregation, [online] Advances in Neural Infromation Processing Systems 13, 2000, p.772 - 778.”(特に、“2 Information Preserving Transformations”(p.773-774)等)、特開平11-66283号公報(特に、段落【0002】?【0008】、【0033】?【0047】等)、“早川 和宏、鈴木 亮、向井 利春、大西 昇,物理法則に基づく視聴覚情報の対応付け,映像情報メディア学会技術報告,日本,社団法人映像情報メディア学会,1999年2月2日,Vol.23 No.8,p.13?18”(特に、「3.4 評価と対応付け」(15頁)等)参照)、引用発明において、ビデオの特徴記述と楽曲の特徴記述間の相関関係を求めることにより、目的の特徴記述に直接変換するようにすることは、当業者が容易に想到しうるものである。

したがって、ここで請求人が主張する本願発明の特徴点も、進歩性を認めるに足るものではなく、上記審判請求書の主張内容に、原審の査定を取り消すべき理由を見出すことはできない。

6.むすび

以上のとおり、本願発明は、本願の特許出願前に日本国内又は外国において頒布された刊行物に記載された発明又は電気通信回線を通じて公衆に利用可能となった発明に基づいて、その出願前にその発明の属する技術の分野における通常の知識を有する者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができない。
したがって、その余の請求項について論及するまでもなく、本願は拒絶すべきものである。

よって、結論のとおり審決する。
 
審理終結日 2012-10-02 
結審通知日 2012-10-09 
審決日 2012-10-22 
出願番号 特願2004-552977(P2004-552977)
審決分類 P 1 8・ 575- Z (G06F)
P 1 8・ 121- Z (G06F)
P 1 8・ 572- Z (G06F)
P 1 8・ 561- Z (G06F)
最終処分 不成立  
前審関与審査官 長谷川 篤男波内 みさ  
特許庁審判長 長島 孝志
特許庁審判官 田中 秀人
酒井 伸芳
発明の名称 意味的関連性に基づくコンテンツ抽出  
代理人 伊東 忠彦  
  • この表をプリントする

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ