• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 特36条6項1、2号及び3号 請求の範囲の記載不備 特許、登録しない(前置又は当審拒絶理由) G06F
審判 査定不服 特36条4項詳細な説明の記載不備 特許、登録しない(前置又は当審拒絶理由) G06F
審判 査定不服 2項進歩性 特許、登録しない(前置又は当審拒絶理由) G06F
管理番号 1293192
審判番号 不服2011-4560  
総通号数 180 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2014-12-26 
種別 拒絶査定不服の審決 
審判請求日 2011-02-28 
確定日 2014-10-22 
事件の表示 特願2007-557936「複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム」拒絶査定不服審判事件〔平成18年 9月 8日国際公開、WO2006/093394、平成20年10月 2日国内公表、特表2008-538021〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 第1 手続の経緯
本件審判請求に係る出願(以下,「本願」という。)は,2006年3月3日(パリ条約による優先権主張外国庁受理,2005年3月4日,大韓民国)を国際出願日とする出願であって,
平成19年9月4日付けで特許法第184条の5第1項の規定による書面,及び,特許法第184条の4第1項の規定による翻訳文が提出されると共に,同日付けで審査請求がなされ,平成22年3月18日付けで拒絶理由通知(平成22年3月23日発送)がなされ,これに対して平成22年7月22日付けで意見書が提出されると共に同日付けで手続補正がなされたが,平成22年10月19日付けで拒絶査定(平成22年10月26日謄本送達)がなされた。
これに対して,「原査定を取り消す,本願は特許をすべきものであるとの審決を求める。」ことを請求の趣旨として平成23年2月28日付けで審判請求がなされると共に同日付けで手続補正がなされ,平成23年5月16日付けで審査官により特許法第164条第3項に定める報告がなされ,平成24年4月24日付けで当審により特許法第134条第4項の規定に基づく審尋(平成24年5月8日発送)がなされ,平成24年8月8日付けで回答書が提出された。
そして,平成25年5月8日付けで当審により拒絶理由通知(平成25年5月14日発送)がなされ,これに対して,平成25年9月13日付けで意見書が提出されると共に同日付けで手続補正がなされ,平成25年12月26日付けで当審により特許法第134条第4項の規定に基づく審尋(平成26年1月7日発送)がなされ,平成26年3月14日付けで回答書の提出があったものである。


第2 特許法第36条(記載要件)について
1 当審拒絶理由
平成25年5月8日付け拒絶理由通知書(以下,「当審拒絶理由通知書」と言う。)によって通知された拒絶理由のうち特許法第36条についての拒絶理由の概要は下記のとおりのものである。
『1)本件出願は、特許請求の範囲、明細書及び図面の記載が下記の点で不備のため、特許法第36条第4項及び第6項に規定する要件を満たしていない。

【理由1】
(第36条第4項第1号)
明細書中においては、本願の請求項1に係る発明の
「収集されたウェブページのURL及びインターネット上における経路を含むデータ」の「分析」、「位置情報形式」及び「複数のウェブページの中で同じ基本構造を持つウェブページを一般化する所定の形式で、マークアップ言語テンプレートを共有するウェブページを選定する基準」に関連して、「仕分け検索サーバー140は、索引サーバー150及び索引DB151との通信によって読み込んだウェブデータの位置情報を分析し、複数の位置情報形式を生成する。ここで、位置情報は、収集されたウェブデータのインターネット上における経路を含む位置情報を意味するもので、好ましくは、ウェブデータのURL(Uniform Resource Locator)を含む。このように生成したURL形式を用いて、収集したウェブページからHTMLテンプレート(HTML Template:Hypertext Markup Language Template)を抽出し、抽出したHTMLテンプレートを用いてウェブページを複数の情報ブロックに区分する。」(段落【0030】)、
「URL形式生成モジュール220は、制御部260又はウェブページ収集モジュール210によって獲得されたウェブページのURLを分析し、URL形式を生成する。本発明でいうURL形式は、複数のウェブページのうち類似な形式を持つ、すなわち、同じ基本骨格を持つウェブページを一般化する所定の形式である。本発明ではHTMLテンプレー
情報ブロックに分け、区分された情報ブロック別に情報を検索する。このとき、HTMLテンプレートを共有するウェブページを選定する基準が必要とされ、この基準として用いられるのがURL形式である。」(段落【0038】)
等と記載されているが、「収集されたウェブページのURL及びインターネット上における経路を含むデータ」の「分析」、「位置情報形式」及び「複数のウェブページの中で同じ基本構造を持つウェブページを一般化する所定の形式で、マークアップ言語テンプレートを共有するウェブページを選定する基準」をどのような具体的な技術的手段により実現しているのかが理解できない。
また、上記「位置情報形式」をどのような具体的な技術的手段により実現しているのかが理解できないため、「生成された位置情報形式を基準にして、同じ位置情報形式を有し関連性があると把握されたウェブページのHTMLタグを含むデータセット(data set)を分析してテンプレートを抽出する」ことがどのような具体的な技術的手段により実現しているのかも理解できない。
・・・(中略)・・・
同様に、請求項4の「該索引語情報及び前記索引語が参照するウェブページである参照ページのURL情報を生成する」こと、「仕分け検索結果情報を生成」すること、「前記ウェブページに含まれるHTMLタグを分析してURL形式を生成する」こと、「前記URL形式を用いて前記ウェブページからテンプレートを抽出する」こと及び「前記ウェブページと同じ基本骨格を持つウェブページを一般化する所定の形式であり、かつ前記HTMLテンプレートを共有するウェブページを選定する基準」をどのような具体的な技術的手段により実現されているのかが理解できない。

(第36条第6項第1号)
・請求項 1-3
上記【理由1】で示したように、請求項1に記載されている
「収集されたウェブページのURL及びインターネット上における経路を含むデータ」の「分析」、「位置情報形式」及び「複数のウェブページの中で同じ基本構造を持つウェブページを一般化する所定の形式で、マークアップ言語テンプレートを共有するウェブページを選定する基準」
に関する具体的な説明は、明細書に記載されていない。よって、請求項1に係る発明が発明の詳細な説明に記載したものであるとは認められない。

・請求項 4-8
請求項4に記載されている
「該索引語情報及び前記索引語が参照するウェブページである参照ページのURL情報を生成する」こと、「仕分け検索結果情報を生成」すること、「前記ウェブページに含まれるHTMLタグを分析してURL形式を生成する」こと、「前記URL形式を用いて前記ウェブページからテンプレートを抽出する」こと及び「前記URL形式は、前記ウェブページと同じ基本骨格を持つウェブページを一般化する所定の形式であり、かつ前記HTMLテンプレートを共有するウェブページを選定する基準であ」ること
に関する具体的な説明も、明細書に記載されておらず、請求項4に係る発明が発明の詳細な説明に記載したものであるとは認められない。

(第36条第6項第2号)
・請求項1-3
請求項1-3に係る発明は、いずれもある種の情報処理を特定するものと認められるものの、その記載が全体的に明確でなく、その情報処理を把握できない。
特に請求項1の「URL情報」及び「位置情報形式」がどのようなものであるのか不明であるため、
「(a1)前記ウェブロボットにより前記収集されたウェブページのURL及びインターネット上における経路を含むデータを分析し、データが位置するウェブページのURL情報を含む位置情報形式を生成する段階」、
「(a2)前記生成された位置情報形式を基準にして、同じ位置情報形式を有し関連性があると把握されたウェブページのHTMLタグを含むデータセット(data set)を分析してテンプレートを抽出する段階」
を明確に把握することができない。
また、「位置情報の形式」、「マークアップ言語テンプレート」、「複数のウェブページの中で同じ基本構造を持つウェブページを一般化する所定の形式で、マークアップ言語テンプレートを共有するウェブページを選定する基準」とは各々何かが不明であるため、「前記位置情報の形式は、複数のウェブページの中で同じ基本構造を持つウェブページを一般化する所定の形式で、マークアップ言語テンプレートを共有するウェブページを選定する基準である」がどのようなことを意味するのかが不明である。
・・・(中略)・・・

・請求項4-8
請求項4-8に係る発明も、いずれもある種の情報処理を特定するものと認められるものの、その記載が全体的に明確でなく、その情報処理を把握できない。
特に請求項4の「前記ウェブページと同じ基本骨格を持つウェブページを一般化する所定の形式」及び「前記HTMLテンプレートを共有するウェブページを選定する基準」がどのようなものであるのか不明であるため、「URL形式」がどのような形式であるのかを明確に把握することができない。そのため、「前記ウェブページに含まれるHTMLタグを分析してURL形式を生成する」こと、「前記URL形式を用いて前記ウェブページからテンプレートを抽出する」ことがどのようなことであるのかを明確に把握することができない。
また、「URL情報」や「仕分け検索結果情報」がどのような情報であるのかも不明である。 』

2 平成25年9月13日付け手続補正書
上記平成25年9月13日付けの手続補正書による補正(以下,「本件補正」と言う。)は,特許請求の範囲を下記本願特許請求の範囲に補正するものである。
<本願特許請求の範囲>
「 【請求項1】
仕分け検索サービス提供方法であって、コンピュータにより実行されるステップが、
(a)ウェブロボットにより収集されたウェブページの位置情報を分析して位置情報形式を生成し、前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出し、前記HTMLテンプレートを用いて前記ウェブページを複数個の情報ブロックに区分する段階と、
(b)区分された前記情報ブロック別に索引語を抽出し、前記索引語が参照する参照ページの位置情報を生成する段階と、
(c)使用者端末から受信した質疑語と前記索引語とを比較し、前記質疑語と同一又は関連した意味を持つ前記参照ページの位置情報を受信し、前記受信した前記参照ページの位置情報に基づいて仕分け検索結果情報を生成して提供する段階と、を含み、
前記(a)段階は、
(a1)前記ウェブロボットにより収集された前記ウェブページの前記位置情報を分析して前記位置情報形式を生成する段階と、
(a2)前記位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する段階と、
(a3)前記HTMLテンプレートを用いて、前記ウェブページの題名、作成者、本文を含む区分に応じて、前記ウェブページを前記複数個の情報ブロックに区分する段階と、
を含み、
前記位置情報形式は、同一のウェブサーバーが管理することを示すURL形式であることを特徴とする仕分け検索サービス提供方法。
【請求項2】
前記(c)段階は、所定の方法によって計算された評価値によって整列されることを特徴とする請求項1に記載の仕分け検索サービス提供方法。
【請求項3】
前記(a)段階の前に、インターネット上のデータを収集して索引化する段階をさらに含むことを特徴とする請求項1に記載の仕分け検索サービス提供方法。
【請求項4】
前記計算された評価値は、質疑管理モジュールによって前記複数個の情報ブロック別に異なる重み値を付けて計算されることを特徴とする請求項2に記載の仕分け検索サービス提供方法。
【請求項5】
複数のウェブページ(Web Page)を提供するウェブサーバーと、
使用者端末機から質疑語を受信して検索結果を生成し、前記使用者端末機に送信する仕分け検索サーバーと、を含むシステムにおける仕分け検索サービス提供方法であって、前記仕分け検索サーバーにより実行されるステップが、
(a)前記使用者端末機から前記質疑語及び仕分け検索要請信号を受信する段階と、
(b)前記ウェブサーバーからウェブページを受信する段階と、
(c)前記ウェブページを複数個の情報ブロックに区分する段階と、
(d)区分された前記情報ブロック別に索引語を抽出し、前記索引語が参照するウェブページである参照ページの位置情報を生成する段階と、
(e)前記質疑語と前記索引語とを比較し、前記質疑語と同一または関連した意味を持つ前記参照ページの位置情報を受信し、前記受信した前記参照ページの位置情報に基づいて仕分け検索結果情報を生成し、前記使用者端末機に送信する段階と、を含み、
前記(c)段階は、
(c1)前記ウェブページの位置情報を分析して位置情報形式を生成する段階と、
(c2)前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出する段階と、
(c3)前記HTMLテンプレートを用いて、前記ウェブページの題名、作成者、本文を含む区分に応じて、前記ウェブページを前記複数個の情報ブロックに区分する段階と、
を含み、
前記位置情報形式は、同一のウェブサーバーが管理することを示すURL形式であり、
前記情報ブロックは、前記HTMLテンプレートで作成されることを特徴とする仕分け検索サービス提供方法。
【請求項6】
前記(d)段階は、
(d1)区分された前記情報ブロック別に、前記索引語を抽出して索引語情報を生成し、索引データベースに保存する段階と、
(d2)前記索引語が参照する前記参照ページの位置情報を生成して前記仕分け検索データベースに保存する段階と、を含むことを特徴とする請求項5に記載の仕分け検索サービス提供方法。
【請求項7】
前記(e)段階は、
(e1)前記情報ブロック別に前記質疑語と同一または関連した前記索引語を検索する段階と、
(e2)前記段階(e1)で前記情報ブロック別に検索した前記参照ページの位置情報を検索する段階と、
(e3)前記段階(e2)で前記情報ブロック別に検索した前記参照ページの位置情報を前記仕分け検索結果情報として生成し、前記使用者端末機に送信する段階と、を含むことを特徴とする請求項5に記載の仕分け検索サービス提供方法。
【請求項8】
前記(e3)段階は、
全体仕分け検索結果情報または情報ブロック別仕分け検索結果情報を含む前記仕分け検索結果情報を生成し、ここで、前記情報ブロック別に異なる重み値を付けて評価値を計算することによって順位体系(Ranking System)による順位を決定し、前記順位によって前記参照ページの位置情報を整列した前記全体仕分け検索結果情報を生成し、前記情報ブロック別に前記質疑語と同一または関連した前記索引語と前記参照ページの位置情報を含む前記情報ブロック別仕分け検索結果情報を生成することを特徴とする請求項7に記載の仕分け検索サービス提供方法。
【請求項9】
前記(e3)段階は、
前記全体仕分け検索結果情報を生成するときに、索引した情報ブロックだけでなく索引していない情報ブロックをも用いて前記順位を決定することを特徴とする請求項7に記載の仕分け検索サービス提供方法。
【請求項10】
前記(e3)段階は、質疑管理モジュールによって前記複数個の情報ブロック別に異なる重み値を付けて計算された評価値によって整列されることを特徴とする請求項7に記載の仕分け検索サービス提供方法。


3 平成25年12月26日付け審尋
上記平成25年12月26日付けで当審によりなされた特許法第134条第4項の規定に基づく審尋の概要は下記のとおりのものである。

『 本件について、下記の見解を検討の上、回答されたい。

<見解>

1.本願の請求項1の「(a)ウェブロボットにより収集されたウェブページの位置情報を分析して位置情報形式を生成し、前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出し、前記HTMLテンプレートを用いて前記ウェブページを複数個の情報ブロックに区分する段階」との記載および「前記(a)段階は、(a1)前記ウェブロボットにより収集された前記ウェブページの前記位置情報を分析して前記位置情報形式を生成する段階と、(a2)前記位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する段階と、(a3)前記HTMLテンプレートを用いて、前記ウェブページの題名、作成者、本文を含む区分に応じて、前記ウェブページを前記複数個の情報ブロックに区分する段階と、を含み、前記位置情報形式は、同一のウェブサーバーが管理することを示すURL形式であること」との記載について、発明の詳細な説明を参照しても、どのような具体的な技術的手段により実現しているのか理解できないため、本願は依然として特許法第36条第4項第1号及び第6項第1号並びに第2号に規定する要件を満たしていないとの疑義がある。
よって、
(1)具体的にどのように「ウェブページ」の「位置情報」を分析して「位置情報形式」を生成するのか、
(2)具体的にどのように「位置情報形式」に基づいて前記「ウェブページ」から「HTMLテンプレート」を抽出するのか、
(3)具体的にどのように「HTMLテンプレート」を用いて前記「ウェブページ」を「複数個の情報ブロック」に区分するのか、
について、「ウェブページ」、「位置情報」、「位置情報形式」、「HTMLテンプレート」、「複数個の情報ブロック」について具体的な事例を挙げ、本願発明の動作が理解できるように説明されたい。』

4 平成26年3月14日付け回答書
上記平成26年3月14日付け回答書による回答の概要は下記のとおりのものである。

『2-1.質問(1.)に対する回答
具体的にどのように「ウェブページ」の「位置情報」を分析して「位置情報形式」を生成するのか、具体的にどのように「位置情報形式」に基づいて「ウェブページ」から「HTMLテンプレート」を抽出するのか、具体的にどのように「HTMLテンプレート」を用いて「ウェブページ」を「複数個の情報ブロック」に区分するのか、については、本願明細書の段落[0030]、[0038]?[0041]に詳細な説明が記載されております。
まず、段落[0030]には、位置情報がURLを含むことが記載されており、位置情報を分析して生成された位置情報形式とURL形式とが等価で用いられています。
段落[0038]-[0041]には、掲示板、ブログ、マイページなどのウェブページのURLを分析することで、同じウェブサーバーで管理されるウェブページであることを示すURLの形式を生成することが記載されています(1.(1)に対する回答)。より具体的に説明致しますと、段落[0038]には、URL形式生成モジュールについて説明を記載しており、位置情報形式に対応して「URL形式」について「すなわち、同じ基本骨格を持つウェブページを一般化する所定の形式である。」とし、さらに「HTMLテンプレートを共有するウェブページを選定する基準」であると記載しております。ここで段落[0039]を参照しますと、「HTMLテンプレートを共有する」の一つの場合として同じ管理者によって生成されたHTMLテンプレートである場合、また、別の例として「掲示板(Board)サービス、ブログ(Blog)サービス、マイページ(Mini Hompy)サービスなどを提供する特定ウェブサーバーによって管理される複数のページに含まれることができる」と記載しております。したがって、URLからURL形式を得る一つの処理として、URLに管理者名が一部として含まれていたり、掲示板であることを示すBBS(Bulettin Board System)という文字列がURLの一部として(サブドメインとして)、含まれている場合を検出し、このURLのウェブページが依拠するHTMLテンプレートの作者やウェブページの種類(掲示板、ブログサービス、マイページサービス)を抽出することがURL形式を得る処理の一例です。
ここで説明致しましたように、管理者名やウェブページの種類を抽出などすることが、同じURL形式を持つウェブページからHTMLテンプレートを抽出することに対応致します(1.(2)に対する回答)。ここで、HTMLテンプレートは、ウェブページの作成を容易にするために、よく使用される部分を一定の構造で作成した基本骨格であり、例えば、<table...>等のタグで定義される形式を示します。
そして、段落[0030]、[0040]には、ウェブページは上記のタグで定義される形式によって、ウェブページの題名、作成者、本文を含む区分に応じて、複数個の情報ブロックに区分することが記載されています(1.(3)に対する回答)。
したがって、本願の請求項1の「(a)ウェブロボットにより収集されたウェブページの位置情報を分析して位置情報形式を生成し、前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出し、前記HTMLテンプレートを用いて前記ウェブページを複数個の情報ブロックに区分する段階」の記載および「前記(a)段階は、(a1)前記ウェブロボットにより収集された前記ウェブページの前記位置情報を分析して前記位置情報形式を生成する段階と、(a2)前記位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する段階と、(a3)前記HTMLテンプレートを用いて、前記ウェブページの題名、作成者、本文を含む区分に応じて、前記ウェブページを前記複数個の情報ブロックに区分する段階と、を含み、前記位置情報形式は、同一のウェブサーバーが管理することを示すURL形式であること」の記載は、上記に示したように、発明の詳細な説明に記載された具体的な技術的手段により実現していることは明確であるので、本願は特許法第36条第4項第1号及び第6項第1号並びに第2号に規定する要件を満たしていると思料致します。 』

5 そこで,上記当審拒絶理由通知書の特許法第36条についての拒絶理由が本件補正によって解消されたか否かについて検討する。

(1)本願明細書の記載
本願明細書の段落【0030】,【0036】,【0038】?【0041】には,下記のように記載されている。
(当審注:下線は,参考のために当審で付与したものである。)
「 【0030】
仕分け検索サーバー140は、索引サーバー150及び索引DB151との通信によって読み込んだウェブデータの位置情報を分析し、複数の位置情報形式を生成する。ここで、位置情報は、収集されたウェブデータのインターネット上における経路を含む位置情報を意味するもので、好ましくは、ウェブデータのURL(Uniform Resource Locator)を含む。このように生成したURL形式を用いて、収集したウェブページからHTMLテンプレート(HTML Template:Hypertext Markup Language Template)を抽出し、抽出したHTMLテンプレートを用いてウェブページを複数の情報ブロックに区分する。また、処理速度の改善などを目的であらかじめ定義されたテンプレート形式を使用する方法も活用することができる。ここで、情報ブロックは、題名、作成者、ヒット数、本文などのウェブページの基本情報と本文内容などを、その情報の種類または属性によってウェブページ内において一定の部分に区分されたものをいう。」
「 【0036】
本発明の好適な実施例による仕分け検索サーバー140は、ウェブページ収集モジュール210、URL形式生成モジュール220、ページ仕分けモジュール230、索引管理モジュール240、質疑管理モジュール250及び制御部260を備えるネットワークサーバーである。」
「 【0038】
URL形式生成モジュール220は、制御部260又はウェブページ収集モジュール210によって獲得されたウェブページのURLを分析し、URL形式を生成する。本発明でいうURL形式は、複数のウェブページのうち類似な形式を持つ、すなわち、同じ基本骨格を持つウェブページを一般化する所定の形式である。本発明ではHTMLテンプレートを共有するウェブページをHTMLテンプレート単位に複数の情報ブロックに分け、区分された情報ブロック別に情報を検索する。このとき、HTMLテンプレートを共有するウェブページを選定する基準が必要とされ、この基準として用いられるのがURL形式である。
【0039】
すなわち、同じHTMLテンプレートを共有する複数のウェブページは、同じ管理者によって生成される可能性が高く、かつウェブページに含まれる内容も類似な事項を含む可能性が高い。また、同じ管理者によって生成されたウェブページは、掲示板(Board)サービス、ブログ(Blog)サービス、マイページ(Mini Hompy)サービスなどを提供する特定ウェブサーバーによって管理される複数のページに含まれることができる。
【0040】
本発明のHTMLテンプレートは、ウェブページの作成を容易にするために、よく使用される部分を一定の構造で作成した基本骨格であり、HTMLで作成されたウェブページの内容を分析するのに用いられる。例えば、<Table...><TD>[文番号]</TD><TD>[題名]</TD>...</TABLE>のようにウェブページを作成する際によく使用されるタグ(Tag)の形式である。通常、ウェブページとして作成されるHTML文書は、HTML文法(構文)に合わせたHTMLタグとテキストとの組合せで構成されるが、HTML文書は、表現しようとする機能によって複数の機能ブロック、すなわち、例えば、メニューを構成するためのメニューブロック、他のポータルサイトと連結するためのリンクブロック、本文内容を含めるためのメッセージブロックなどで構成される。これらの機能ブロックはウェブページ内でよく使用されることからHTMLテンプレートで作成され、使用者の便宜を図っている。
【0041】
掲示板サービス、ブログサービス、マイページサービスなどのサービスを提供する特定ウェブサーバー130は、自身の管理する大部分のウェブページをHTMLテンプレートを用いて作成することから、一つのウェブサーバー130によって管理されるウェブページは、いずれもHTMLテンプレートを共有するようになる。したがって、同じURL形式を持つウェブページからHTMLテンプレートを抽出でき、抽出したHTMLテンプレートを用いれば、ウェブページを複数の情報ブロックに区分することが可能になる。」

(2) 第36条第4項第1号について
ア 当審拒絶理由通知書の「第36条第4項第1号」において,請求項1に係る発明に関して指摘した,「収集されたウェブページのURL及びインターネット上における経路を含むデータ」(本件補正によって「収集されたウェブページの位置情報」と補正。)の「分析」及び「位置情報形式」は,依然としてどのような具体的手段により実現しているのかが理解できない。
なお,この点について,上記平成25年9月13日付け意見書では,
『この「分析」は、仕分け検索サーバーに備えられたURL形式生成モジュールによって行われ([0036]、[0038])、ウェブページのURLを含む位置情報から、同一のウェブサーバーが管理することを示すURL形式である位置情報形式を生成します([0039]-[0041])。』
との主張がなされると共に,上記平成26年3月14日付け回答書では,
『具体的にどのように「ウェブページ」の「位置情報」を分析して「位置情報形式」を生成するのか、具体的にどのように「位置情報形式」に基づいて「ウェブページ」から「HTMLテンプレート」を抽出するのか、具体的にどのように「HTMLテンプレート」を用いて「ウェブページ」を「複数個の情報ブロック」に区分するのか、については、本願明細書の段落[0030]、[0038]?[0041]に詳細な説明が記載されております。
・・・(中略)・・・
したがって、URLからURL形式を得る一つの処理として、URLに管理者名が一部として含まれていたり、掲示板であることを示すBBS(Bulettin Board System)という文字列がURLの一部として(サブドメインとして)、含まれている場合を検出し、このURLのウェブページが依拠するHTMLテンプレートの作者やウェブページの種類(掲示板、ブログサービス、マイページサービス)を抽出することがURL形式を得る処理の一例です。 』
との主張がなされている。
しかしながら,上記本願明細書の段落【0030】,【0036】,【0038】?【0041】の記載によれば,「位置情報形式」が,「掲示板(Board)サービス・・・を提供する特定ウェブサーバーによって管理される複数のページ」に含まれる「同じ管理者によって生成されたウェブページ」である可能性が高い「同じHTMLテンプレートを共有する複数のウェブページ」を選定する基準として用いられるものであり,「同じ基本骨格を持つウェブページを一般化する所定の形式である」ことは,理解できるが,「収集されたウェブページの位置情報」の「分析」と,「位置情報形式」自体が,どのような具体的な技術的手段により実現しているのかは,依然として理解できない。また,「URLからURL形式を得る一つの処理として」上記平成26年3月14日付け回答書にて主張している「URLに管理者名が一部として含まれていたり、掲示板であることを示すBBS(Bulettin Board System)という文字列がURLの一部として(サブドメインとして)、含まれている場合を検出し、このURLのウェブページが依拠するHTMLテンプレートの作者やウェブページの種類(掲示板、ブログサービス、マイページサービス)を抽出する」ことは,本願明細書に直接記載されたことではないし,当業者が本願明細書の記載から読み取ることができることでもない。

イ 当審拒絶理由通知書の「第36条第4項第1号」において請求項1に係る発明に関して指摘した,「位置情報形式」をどのような具体的な技術的手段により実現しているのかが理解できないため,「生成された位置情報形式を基準にして、同じ位置情報形式を有し関連性があると把握されたウェブページのHTMLタグを含むデータセット(data set)を分析してテンプレートを抽出する」(本件補正によって「位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する」と補正。)ことが,依然としてどのような具体的な技術的手段により実現しているのかが理解できない。
なお,この点について,上記平成26年3月14日付け回答書では,『管理者名やウェブページの種類を抽出などすることが、同じURL形式を持つウェブページからHTMLテンプレートを抽出することに対応致します』との主張がなされている。
しかしながら,本願発明における「HTMLテンプレート」とは,本願明細書の段落【0040】の記載及び技術常識を参酌すると,「ウェブページの作成を容易にするために、よく使用される部分を一定の構造で作成した基本骨格であり、・・・例えば、<Table...><TD>[文番号]</TD><TD>[題名]</TD>...</TABLE>のようにウェブページを作成する際によく使用されるタグ(Tag)の形式である」と認められるから,単に,管理者名やウェブページの種類を抽出などすることのみでは,HTMLテンプレートを抽出することにならないことは,当業者にとって自明である。

ウ 当審拒絶理由通知書の「第36条第4項第1号」において本件補正前の請求項4に係る発明に関して指摘した,「前記ウェブページに含まれるHTMLタグを分析してURL形式を生成する」(本件補正によって「前記ウェブページの位置情報を分析して位置情報形式を生成する」と補正。)こと及び「前記URL形式を用いて前記ウェブページからテンプレートを抽出する」(本件補正によって「前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出する」と補正。)ことは,上記ア及びイに記載したのと同様の理由により,依然としてどのような具体的な技術的手段により実現しているのかが理解できない。

エ したがって,当審拒絶理由通知書の「第36条第4項第1号」において指摘した不備は解消されていない。

(3) 第36条6項第1号について
ア 請求項1?4
上記(2)アにおいて記載したように,「収集されたウェブページのURL及びインターネット上における経路を含むデータ」(本件補正によって「収集されたウェブページの位置情報」と補正。)の「分析」及び「位置情報形式」は,どのような具体的手段により実現しているのかが理解できるように本願明細書に記載されたものではないから,請求項1に係る発明の「収集されたウェブページの位置情報を分析して位置情報形式を生成」する構成が,本願明細書に記載したものであるとは認められない。
また,請求項2?4に係る発明は,請求項1を直接又は間接に引用するものであるから,請求項1に係る発明と同様に,本願明細書に記載したものであるとは認められない。

イ 請求項5?10
上記(2)ウにおいて記載したように,「前記ウェブページに含まれるHTMLタグを分析してURL形式を生成する」(本件補正によって「前記ウェブページの位置情報を分析して位置情報形式を生成する」と補正。)こと及び「前記URL形式を用いて前記ウェブページからテンプレートを抽出する」(本件補正によって「前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出する」と補正。)ことは,どのような具体的手段により実現しているのかが理解できるように本願明細書に記載されたものではないから,請求項5に係る発明の「前記ウェブページの位置情報を分析して位置情報形式を生成する」こと及び「前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出する」ことが,本願明細書に記載したものであるとは認められない。
また,請求項6?10に係る発明は,請求項5を直接又は間接に引用するものであるから,請求項5に係る発明と同様に,本願明細書に記載したものであるとは認められない。

ウ したがって,当審拒絶理由通知書の「第36条第6項第1号」において指摘した不備は解消されていない。

(4) 第36条6項第2号について
ア 請求項1?4
上記(2)アにおいて記載したように,「収集されたウェブページの位置情報」の「分析」と,「位置情報形式」は,どのような具体的手段により実現しているのかが理解できないし,「位置情報形式」との用語自体は,一般的な技術用語とも言えないから,請求項1に係る発明の「(a1)前記ウェブロボットにより収集された前記ウェブページの前記位置情報を分析して前記位置情報形式を生成する段階」と「(a2)前記位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する段階」を明確に把握することができない。
なお,この点について,上記平成25年9月13日付け意見書では,
『「位置情報形式」は、補正事項キによって「位置情報形式は、同一のウェブサーバーが管理することを示すURL形式であること」がより明確になった』
との主張がなされている。
しかしながら,「位置情報形式は、同一のウェブサーバーが管理することを示すURL形式であること」が明確になったとしても,そもそも「同一のウェブサーバーが管理することを示すURL形式」をどのような具体的手段により実現しているのかも理解できないから,「同一のウェブサーバーが管理することを示すURL形式」である「位置情報形式」も依然としてどのようなものであるかが不明である。
また,請求項2?4に係る発明は,請求項1を直接又は間接に引用するものであるから,請求項1に係る発明と同様に不明確である。

イ 請求項5?10
上記(2)ウにおいて記載したように,「前記ウェブページに含まれるHTMLタグを分析してURL形式を生成する」(本件補正によって「前記ウェブページの位置情報を分析して位置情報形式を生成する」と補正。)こと及び「前記URL形式を用いて前記ウェブページからテンプレートを抽出する」(本件補正によって「前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出する」と補正。)ことは,どのような具体的手段により実現しているのかが理解できるように本願明細書に記載されたものではないから,請求項5に係る発明の当該事項を明確に把握することはできない。
また,請求項6?10に係る発明は,請求項5を直接又は間接に引用するものであるから,請求項5に係る発明と同様に不明確である。

ウ したがって,当審拒絶理由通知書の「第36条第6項第2号」において指摘した不備は解消されていない。

6 小結
以上のとおり,本願は,明細書及び特許請求の範囲の記載が,依然として,特許法第36条第4項第1号並びに第6項第1号及び第2号に規定する要件を満たしていない。


第3 特許法第29条第2項(進歩性)について
1 本願発明
本願の請求項1に係る発明(以下,「本願発明」と言う。)は,本件補正後の特許請求の範囲の請求項1に記載された事項により特定される,以下のとおりのものである。
「仕分け検索サービス提供方法であって、コンピュータにより実行されるステップが、
(a)ウェブロボットにより収集されたウェブページの位置情報を分析して位置情報形式を生成し、前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出し、前記HTMLテンプレートを用いて前記ウェブページを複数個の情報ブロックに区分する段階と、
(b)区分された前記情報ブロック別に索引語を抽出し、前記索引語が参照する参照ページの位置情報を生成する段階と、
(c)使用者端末から受信した質疑語と前記索引語とを比較し、前記質疑語と同一又は関連した意味を持つ前記参照ページの位置情報を受信し、前記受信した前記参照ページの位置情報に基づいて仕分け検索結果情報を生成して提供する段階と、を含み、
前記(a)段階は、
(a1)前記ウェブロボットにより収集された前記ウェブページの前記位置情報を分析して前記位置情報形式を生成する段階と、
(a2)前記位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する段階と、
(a3)前記HTMLテンプレートを用いて、前記ウェブページの題名、作成者、本文を含む区分に応じて、前記ウェブページを前記複数個の情報ブロックに区分する段階と、
を含み、
前記位置情報形式は、同一のウェブサーバーが管理することを示すURL形式であることを特徴とする仕分け検索サービス提供方法。」

2 先行技術文献
(1) 引用文献1
当審拒絶理由通知書の理由2で引用された,本願の優先日前に頒布された刊行物である,特開2002-297627号公報(平成14年10月11日公開。以下,「引用文献1」という。)には,図面とともに,次の記載がある。
(当審注:下線は,参考のために当審で付与したものである。以下、同じ。)
A 「【0001】
【発明の属する技術分野】本発明は、例えばWWW(world wide web)から機械的にデータを収集してデータベース化し、検索サービスを提供するサーチエンジンに適用される情報収集システム、情報処理端末及び情報収集方法に関するものである。
【0002】
【従来の技術】インターネットは自立分散型ネットワークゆえに、膨大な情報が殆どコントロールされることなく無秩序に分散している。
【0003】このような情報の中から目的の情報を探し出すには、サーチエンジンサイトの検索サービスを利用するのが一般的である。
【0004】サーチエンジンは、所謂WWWロボットによって世界中のWebサーバから自動的にデータ収集する機能、それを要約して蓄積するデータベース化機能、利用者と接続するWebサーバ機能、利用者に他のWebに対するキーワード検索や全文検索などのサービスを提供する検索エンジン機能、検索結果をHTML形式で提供する機能を持っている。
【0005】
【発明が解決しようとする課題】上記のようなサーチエンジンにおいて、世界中のWebサーバにアクセスして情報を収集することや、収集した膨大な情報からキーワードを抽出し、所定のカテゴリーに分類してデータベース化する等の処理を行うことは、非常に負荷の大きい作業であり、多大な設備と時間を必要としていた。」

(2) 引用文献2
当審拒絶理由通知書の理由2で引用された,本願の優先日前に頒布された刊行物である,特開2004-220251号公報(平成16年8月5日公開。以下,「引用文献2」という。)には,図面とともに,次の記載がある。
B 「【0003】
このように、従来技術ではWebページの検索を行う場合には、予めWebページを収集したときの情報をそのまま利用して検索を行うのが一般的である。また、既存の技術ではWebサーバから取得する更新日時の情報が正確でないため、検索結果を日付順に並べて検索結果を表示することができない。また、内容を比較して更新日時を推定する場合は自動的に挿入される広告やヘッドラインなどの部分により正確に更新されたかどうかを推定できないという問題がある。
このような、課題を解決する手法としては特許文献1に示すような手法で本文の記事部分を特定し抽出する技術が知られている。
【0004】
【特許文献1】
特開2002-334090号公報
【0005】
【発明が解決しようとする課題】
しかしながら、特許文献1に示すシステムにあっては、同一のドメイン内でのWebページを複数のブロックに分割して比較することにより、対象のブロックの出現回数をもとに本文部分の特定を行うため、定期的に収集したWebページのデータから本文部分の特定を行うためにはブロックの出現回数をデータベースに記録し、データベースを参照するという処理をその都度実行しなければならない。このためリアルタイムで高速に本文部分の特定を行うためには、作業を行うサーバのメモリやCPUなどのリソースを大量に消費してしまうという問題がある。
【0006】
本発明は、このような事情に鑑みてなされたもので、WWW上でニュースサイト、電子掲示板、個人の日記サイトなど特定のテンプレートが設定されていて、機械的にWebページを作成するような文書の中から、メニューやコピーライト、自動的に挿入されるニュースのヘッドラインなどの部分を除いて本文部分のみを特定することが可能なルールを作成する情報抽出規則作成システム、情報抽出規則作成方法及び情報抽出規則作成プログラムを提供することを目的とする。」

C 「【0022】
次に、図1に示すシステムの動作を説明する。初めに、収集ロボット3の動作を説明する。収集ロボット3は、予め決められているURLに基づいて、複数のWebサーバ2からWeb情報の収集を行い、収集したWeb情報をWeb情報データベース4に蓄える。この動作は、予め決められた時間間隔(例えば、1日に1回)で実行され、収集された情報には、収集された日時と情報提供元のURLが識別できる情報が付与されてWeb情報データベース4に蓄えられる。Web情報データベース4に蓄えられるWeb情報は、HTML(Hypertext MarkupLanguage)の形式で蓄えられる。
【0023】
次に、図2を参照して、本文抽出部11の動作を説明する。まず、本文抽出部11は、Web情報データベース4からWebページデータ(HTMLデータ)を読み出す(ステップS1)。続いて、本文抽出部11は、読み込んだWebページのデータを解析してブロックに分割する(ステップS2)。ブロックの分割は、HTMLのタグで区切られているテキスト部分をひとつのブロックとして分割する。HTMLのタグは見出し文や本文の開始位置と終了位置を指定する括弧のようなもので、始まりを示す<TAG>の形式のタグと、終りを示す</TAG>の形式のタグをセットにして使われるものである。例えば、読み出したHTMLが、
<TAG>
文字列....
</TAG>
という場合には<TAG>と</TAG>で囲まれる文字列の部分が1つのブロックとなる。また、読み出したHTMLが、
<TAG1>
<TAG2>
文字列1.....
</TAG2>
文字列2.....
</TAG1>
という場合には文字列1、文字列2の二つのブロックに分割する。」

D 「【0031】
次に、図4を参照して適用ルール作成部14の動作を説明する。まず、適用ルール作成部14は、ルールデータベース13より抽出規則のデータを取得する(ステップS31)。続いて、適用ルール作成部14は、取得した抽出規則の情報を、URLや抽出規則の類似しているものをグループにする(ステップS32)。例えば、「http://sample.co.jp/sample/001.html」、「http://sample.co.jp/sample/002.html」などのように、URLの特定の部分が数値(この例では、001と002)になっており、置き換えることが可能である場合や、特定のディレクトリ以下である場合などのような場合に、そのURLが当てはまる抽出規則を調べ、適用する抽出規則が同一である場合には、複数のURLから同一の抽出規則を当てはめることが可能な抽出規則をグループ化し、複数のURLが「http://sample.co.jp/sample/*.html」という表現のURLを作成する。この例では、「*」の部分を除く文字列が一致するURLが対象となることを意味する。
【0032】
次に、適用ルール作成部14は、ここで作成した、URLの表現と、抽出規則を適用ルールデータベース16に保存する(ステップS33)。複数の抽出規則が存在する場合には、適用ルールデータベースには、「URL表現 抽出規則1抽出規則2」などのように列記して保存する。
この処理動作により、ルール作成部12において作成された抽出規則と、この抽出規則が適用されるURLが関係付けられて適用ルールデータベース16に保存されたこととなる。
なお、図2、図3、図4に示す処理動作(本文抽出部11、ルール作成部12、適用ルール作成部14が行う処理動作)は、初めの一回のみ実行するだけでよく、抽出規則が作成された後は、情報を抽出する度に行う必要はない処理である。
【0033】
次に、図5を参照してルール適用部15の動作を説明する。まず、ルール適用部15は、適用ルールデータベース16から本文部分抽出規則と適用先のURLを読み出し、メモリ上に保存する(ステップS41)。続いて、ルール適用部15は、Web情報データベース4からWebページ情報を読み出す(ステップS42)。そして、読み出したWebページ情報の提供元URLが、本文部分抽出規則のURLの表現とが適合するかを判定する(ステップS43)。この判定の結果、適合しないのであればステップS47へ移行する。一方、適合するのであれば、読み出したWebページの構造を解析する(ステップS44)。これにより木構造またはコメントの情報が得られる。」

E 「【0038】
次に、図8を参照して、検索インデックスデータベース8を使用して情報の検索を行う検索システム9の動作を説明する。まず、検索システム9は、図示しないクライアントから検索キーワードを受け取る(ステップS71)。これを受けて、検索システム9は、検索インデックスデータベース8を参照して、受け取った検索キーワードが含まれるURLを抽出する(ステップS72)。そして、抽出したURLから、保存されている情報の更新日時を取得し(ステップS73)、取得した更新日時の順序にURLを並び替えてクライアントに表示する(ステップS74)。
このように、本文部分のみを抽出する規則を使用して、検索インデックスを作成するようにしたため、検索効率を向上させることが可能となる。」

F 「【0041】
【発明の効果】
以上説明したように、本発明によれば、Webページの中から利用者にとって必要だと思われる本文部分の抽出を機械的に行うことできるという効果が得られる。このことによって、利用者がWebページをキーワードによる全文検索を行うときには、利用者が必要としている本文部分にキーワードが含まれるWebページの検索を行うことが可能で、検索精度を向上させることが可能になる。また、Webページの更新日時を推定するときに、自動的に挿入される、最新のニュースのヘッドラインや、広告などに影響されることなく本文が変化しているかどうかで更新されたかどうかを決定可能なので更新日時推定精度が向上する。また、初回のみに本文抽出を行うときに情報抽出規則を作成し、この抽出規則に則って、2回目以降の情報抽出を行うようにしたため、すべてのWebページを解析しブロックの出現回数をその都度求め、この出現回数に基づいて本文部分を特定する方法に比べて、より高速に本文部分の抽出が行うことが可能になるという効果も得られる。」

(3) 引用文献3
当審拒絶理由通知書の理由2で引用された,本願の優先日前に頒布された刊行物である,波多野賢治 外3名,統計量を用いたXML部分文書検索システムの実装,第15回データ工学ワークショップ(DEWS2004)論文集,電子情報通信学会(平成16年6月18日公開。以下,「引用文献3」という。)には,図面とともに,次の記載がある。
G 「Extensible Markup Language (XML)[6]は,1998年にWorldWide Web Consortium(W3C)でデータ交換のためのフォーマットとして標準化されて以来,多くのアプリケーションで用いられるようになっている.したがって,ネットワーク上に存在するあらゆるデータが,近い将来,XML形式で記述されるようになり,HyperText Markup Language (HTML)[25]が爆発的に増加しWeb検索エンジンに対する需要が高まったように,XML検索エンジンに対する期待は非常に大きい.」(第1ページ左欄第2行?同ページ左欄第9行)

H 「我々の研究で開発を進めているXML検索エンジンは,これまで提案されているWeb検索エンジンとは異なり,検索対象はXML文書ではなくその部分文書としている.なぜなら,サイズが巨大なXML文書集合から利用者の問合せにふさわしい情報を検索する際,検索エンジンの検索結果としてXML文書のリストが返されても,返されたXML文書の中からさらにどの部分か問合せに適合しているのかを調べなくてはならず,利用者にとって非常に煩雑であるためである.そのため,我々のXML検索エンジンのデータモデルは,XPath 1.0[8]で定義されているXPathデータモデルに基づいている.XPathデータモデルを利用することで,XML部分文書をタグ名の並びで指定でき,またXML文書中の区切りを表現することが可能となる.XPathデータモデルでは,XML部分文書を以下のように定義できる.」(第2ページ左欄第42行?同ページ右欄第8行)

I 「[定義1](XML部分文書)XML文書中に出現するすべての要素について,開始タグと終了タグで囲まれた部分,すなわち,文書ノードまたは要素ノードを根とする木全体をXML部分文書と呼ぶ.本稿ではこのようなXML部分文書を,ノードにつけられているIDnを利用してXML部分文書#nと呼ぶ.」(第2ページ右欄第9行?同ページ右欄13行)

J

(第3ページ左欄)

K 「整形式のXML文書から利用者のキーワード問合せにふさわしいXML部分文書を検索するためには,検索対象XML文書群からあらかじめ検索結果として返されるであろうXML部分文書を抽出し,その部分文書に含まれている単語の出現頻度を基に各XML部分文書の特徴量を計算し,その特徴量と問合せの特徴量を比較する必要がある.つまり,整形式のXML文書からあらかじめ検索結果となると予想される部分文書を抽出する以外は,現在,実用化されているWeb検索エンジンと基本的には同じである.」(第5ページ左欄第1行?同ページ左欄第9行)

L 「XML部分文書抽出部で得られた各XML部分文書に対して,不要語処理,接辞処理などの前処理を行った後,含まれている索引語の出現頻度を数える.また,索引語の出現頻度に対するXML部分文書数についても集計し,図3を得る.最終的に,明らかにべき乗分布にしたがっているXML部分文書(図3中の四角破線内に分布しているXML部分文書)をMPDとし,それらだけで索引ファイルを作成する.」(第5ページ右欄第7行?同ページ右欄第13行)

3 引用発明の認定
(1) 上記Aの記載から,引用文献1には,次の技術的事項が記載されている。
ア 引用文献1の段落【0001】の記載等から,引用文献1には「検索サービスを提供するサーチエンジンに適用される方法」が記載されていると言える。
イ 引用文献1の段落【0004】の記載等から,引用文献1には「サーチエンジンは所謂WWWロボットによって自動的にデータを収集する」ことが記載されていると言える。
ウ 引用文献1の段落【0005】の記載等から,引用文献1には「収集した情報からキーワードを抽出」することが記載されていると言える。
エ 引用文献1の段落【0004】の記載等から,引用文献1には「利用者に他のWebに対するキーワードを検索するサービスを提供する」ことが記載されていると言える。

(2)これらのことから,引用文献1には,次の発明(以下,「引用発明」という。)が記載されていると認められる。
「検索サービスを提供するサーチエンジンに適用される方法であって,
WWWロボットによってサーチエンジンが自動的にデータを収集すること,
収集した情報からキーワードを抽出すること,
利用者に他のWebに対するキーワード検索をするサービスを提供すること,を含む方法」

4 対比
(1) 本願発明と引用発明を対比する。
ア 引用発明の「検索サービスを提供するサーチエンジンに適用される方法」がコンピュータにより実行されるものであり,かつ複数のステップからなるものであることは自明であるから,引用発明の「検索サービスを提供するサーチエンジンに適用される方法」は,本願発明の「コンピュータにより実行されるステップ」を備える「仕分け検索サービス提供方法」に相当する。

イ 引用発明の「WWWロボット」は本願発明の「ウェブロボット」に相当することから,引用発明の「WWWロボットによってサーチエンジンが自動的にデータを収集すること」と本願発明の「ウェブロボットにより収集されたウェブページの位置情報を分析して位置情報形式を生成し、前記位置情報形式に基づいて前記ウェブページからHTMLテンプレートを抽出し、前記HTMLテンプレートを用いて前記ウェブページを複数個の情報ブロックに区分する段階と」は,「ウェブロボットによりウェブページの情報を収集する」点で共通する。

ウ サーチエンジンにおいて,抽出したキーワードに対して当該キーワードを抽出したURL等の位置情報を付与することは,当業者にとって自明であるから,引用発明の「収集した情報からキーワードを抽出すること」は,本願発明の「索引語を抽出し、前記索引語が参照する参照ページの位置情報を生成する」ことに相当する。

エ 「キーワード検索」とは,利用者によって入力された質疑語と,検索対象となる情報にあらかじめ対応付けられた索引語を比較することで,利用者に所望の情報を提供する機能を指す一般的な技術用語であって,Webに対する検索とは,Web上のページを検索することであることが,当業者にとって自明である。してみれば,引用発明の「他のWebに対するキーワード検索」は,質疑語と索引語を比較して,質疑語と何らかの意味で関連した意味を持つ索引語が参照するページを検索して,検索された当該ページの情報を提供するものであること,及び,質疑語が利用者の端末から受信されるものであることは,当業者にとって自明であるから,引用発明の「利用者に他のWebに対するキーワードを検索するサービスを提供すること」と,本願発明の「使用者端末から受信した質疑語と前記索引語とを比較し、前記質疑語と同一又は関連した意味を持つ前記参照ページの位置情報を受信し、前記受信した前記参照ページの位置情報に基づいて仕分け検索結果情報を生成して提供する段階」は,「使用者端末から受信した質疑語と前記索引語とを比較し、前記質疑語と同一又は関連した意味を持つ前記参照ページに基づいて検索結果情報を生成して提供する」ことを含む点で共通する。

(2) 以上のことから,本願発明と引用発明の一致点及び相違点は次のとおりである。

【一致点】
「仕分け検索サービス提供方法であって,コンピュータにより実行されるステップが,
(a)ウェブロボットによりウェブページの情報を収集することと,
(b)索引語を抽出し,前記索引語が参照する参照ページの位置情報を生成することと,
(c)使用者端末から受信した質疑語と前記索引語とを比較し,前記質疑語と同一又は関連した意味を持つ前記参照ページに基づいて検索結果情報を生成して提供すること,
を含む仕分け検索サービス提供方法。」

【相違点1】
本願発明は,「(a1)前記ウェブロボットにより収集された前記ウェブページの前記位置情報を分析して前記位置情報形式を生成する」のに対して,引用発明は,位置情報を分析して位置情報形式を生成する旨が特定されていない点。

【相違点2】
本願発明は,「(a2)前記位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する」のに対して,引用発明は,そのような構成を備えていない点。

【相違点3】
本願発明は,「(a3)前記HTMLテンプレートを用いて、前記ウェブページの題名、作成者、本文を含む区分に応じて、前記ウェブページを前記複数個の情報ブロックに区分する」のに対して,引用発明は,そのような構成を備えていない点。

【相違点4】
本願発明は,「(b)区分された前記情報ブロック別に索引語を抽出し、前記索引語が参照する参照ページの位置情報を生成する」のに対して,引用発明は,情報ブロック別に索引語を抽出する構成を備えていない点。

【相違点5】
本願発明は,「(c)使用者端末から受信した質疑語と前記索引語とを比較し、前記質疑語と同一又は関連した意味を持つ前記参照ページの位置情報を受信し、前記受信した前記参照ページの位置情報に基づいて仕分け検索結果情報を生成して提供する」のに対して,引用発明は,参照ページの位置情報に基づいて仕分け検索結果情報を生成する旨の特定がなされていない点。

【相違点6】
本願発明において,「前記位置情報形式は、同一のウェブサーバーが管理することを示すURL形式である」のに対して,引用発明は,そのような特定がなされていない点。

5 判断
(1) 上記相違点について検討する。
ア 相違点1及び相違点2について
(ア) 本願発明の,「(a1)前記ウェブロボットにより収集された前記ウェブページの前記位置情報を分析して前記位置情報形式を生成する段階」と「(a2)前記位置情報形式に基づいて、同じ位置情報形式を有し関連性があると把握されたウェブページから、HTMLタグを含むデータセット(data set)を分析して前記HTMLテンプレートを抽出する段階」は、上記第2 5(4)アにて述べたとおり不明確であるから,当該構成についての進歩性について厳密に検討することは,困難である。そこで,本願発明が,上記平成26年3月14日付け回答書における
「URLからURL形式を得る一つの処理として、URLに管理者名が一部として含まれていたり、掲示板であることを示すBBS(Bulettin Board System)という文字列がURLの一部として(サブドメインとして)、含まれている場合を検出し、このURLのウェブページが依拠するHTMLテンプレートの作者やウェブページの種類(掲示板、ブログサービス、マイページサービス)を抽出することがURL形式を得る処理の一例です。
ここで説明致しましたように、管理者名やウェブページの種類を抽出などすることが、同じURL形式を持つウェブページからHTMLテンプレートを抽出することに対応致します。」
との主張のとおりのものであるとして,検討する。

(イ) 上記B?D,Fの各記載から,引用文献2には,電子掲示板や個人の日記サイトなど特定のテンプレートが設定された文書の中から,本文部分を検索の対象とするために,本文部分のみを特定することが可能な抽出規則を作成し,URLの類似しているものをグループ化することで,複数のURLから同一の抽出規則を当てはめることが可能なページをグループ化する構成が記載されていると言える。
そして,引用発明と引用文献2記載の発明は,Webの検索に関するものである点で共通であり,さらに,検索を行う際に,特定の部分に含まれる情報を重視して検索を行いたいとの課題は,本願の優先日において既に周知の課題にすぎないから,引用発明に対して,当該周知の課題を解決するために,引用文献2記載の上記構成を適用すること,すなわち,相違点1及び相違点2に係る構成とすることは,当業者であれば容易に想到し得たことである。
よって,相違点1及び相違点2は格別なものではない。

イ 相違点3について
上記G?Jの各記載から引用文献3には,XML文書の部分文書を検索対象とする検索エンジンにおいて,author,title,又はsectionのいずれかのみからなる要素ノードを備えたXML文書と,開始タグと終了タグで囲まれた部分,すなわち文書ノード又は要素ノードを根とする木全体を部分文書を呼ぶこととが記載されている,すなわち,検索エンジンにおいて,author,title,及びsectionを含む区分に区分された部分文書を検索対象とすることが記載されていると言える。また,引用文献3に記載された構成は,開始タグと終了タグで囲まれた部分を各ノードとする構成であるから,各々のタグを含む何らかのテンプレートを用いて文書の区切りを行うことは,当業者にとって自明である。
そして,引用発明と引用文献3に係る発明は,マークアップ言語で記述された文書を検索することを想定した検索エンジンである点で共通であり,さらに,検索を行う際に,文書の特定の部分に含まれる情報を重視して検索を行いたいのとの課題は,本願の優先日において既に周知の課題にすぎないから,引用発明に対して,当該周知の課題を解決するために,引用文献3記載の上記構成を適用して,文書を,題名,作成者,及び本文を含む区分に応じた部分文書,すなわち情報ブロックに区分すること,すなわち,相違点3に係る構成とすることは,当業者であれば容易に想到し得たことである。
よって,相違点3は格別なものではない。

ウ 相違点4について
上記H,K,及びLの各記載から引用文献3には,XML文書の部分文書を検索対象とする検索エンジンにおいて,各部分文書別に索引ファイルを作成することが記載されていると言える。そして,引用発明において,文書を,題名,作成者,及び本文を含む区分に応じた情報ブロックに区分することが当業者が容易に想到することであることは,上記イにおいて述べたとおりである。
してみれば,索引語を抽出し,前記索引語が参照する参照ページの位置情報を生成する構成(すなわち,参照ページに索引語を付与する構成)を備えた引用発明において,参照ページを,題名,作成者,及び本文を含む区分に応じた情報ブロックに区分する構成とする際に,併せて,引用文献3記載の部分文書別(すなわち,情報ブロック別)に索引語を付与する構成を適用して,「(b)区分された前記情報ブロック別に索引語を抽出し、前記索引語が参照する参照ページの位置情報を生成する」構成とすること,すなわち,相違点4に係る構成とすることは,当業者であれば容易に想到し得たことである。
よって,相違点4は格別なものではない。

エ 相違点5について
上記Eの記載から引用文献2には,クライアントから受け取った検索キーワードに対応する検索インデックスが付与されたページのURLをクライアントに表示する構成,すなわち,使用者端末から受信した質疑語に対応する索引語に応じたページの位置情報を使用者に提供することが記載されていると言える。
してみれば,引用発明と引用文献2記載の発明は,使用者端末から受信した質疑語に対応する索引語に応じたページに基づいた検索結果を提供する構成である点で共通であるので,引用文献2記載の上記構成を引用発明に適用して,参照ページの位置情報に基づいて仕分け検索結果情報を生成する構成とすること,すなわち,相違点5に係る構成とすることは,当業者であれば容易に想到し得たことである。
よって,相違点5は格別なものではない。

オ 相違点6について
電子掲示板や日記サイトのように,類似のURLからなる一連のページを同一のウェブサーバで管理することは、従来から当業者が普通に採用している常とう手段にすぎないから,上記アで示したように引用発明に引用文献2記載の構成を適用する際に,引用文献2記載の同一の抽出規則を当てはめることが可能なグループ化されたページを,同一のウェブサーバで管理すること,すなわち,相違点6に係る構成とすることは,当業者が適宜選択し得る設計事項にすぎない。
よって,相違点6は格別なものではない。

(2) 上記で検討したごとく,各相違点はいずれも格別なものではなく,また,各相違点を総合的に勘案しても,本願発明の奏する作用効果は,上記引用発明及び引用文献2,3に記載された発明の奏する作用効果から予測される範囲内のものにすぎず,格別顕著なものということはできない。
したがって、本願発明は、上記引用発明及び引用文献2,3に記載された発明に基づいて、当業者が容易に発明をすることができたものである。

6 小結
以上のとおり,本願請求項1に係る発明は,その出願前に日本国内において頒布された刊行物に記載された発明又は電気通信回線を通じて公衆に利用可能となった発明に基づいて,当業者が容易に発明することができたものである。


第4 むすび
上記第2のとおり、本願は,明細書及び特許請求の範囲の記載が,特許法第36条第4項1号並びに第6項第1号及び第2号に規定する要件を満たしていないものであり,また,上記第3のとおり,本願請求項1に係る発明は,その出願前に日本国内において頒布された刊行物に記載された発明又は電気通信回線を通じて公衆に利用可能となった発明に基づいて,当業者が容易に発明することができたものであるから,本願は特許法第29条第2項の規定により特許を受けることができないものである。

したがって,本願について「原査定を取り消す,本願は特許をすべきものである」との審決をすることはできない。

よって,上記結論のとおり審決する。
 
審理終結日 2014-05-21 
結審通知日 2014-05-27 
審決日 2014-06-09 
出願番号 特願2007-557936(P2007-557936)
審決分類 P 1 8・ 121- WZ (G06F)
P 1 8・ 536- WZ (G06F)
P 1 8・ 537- WZ (G06F)
最終処分 不成立  
前審関与審査官 齊藤 貴孝  
特許庁審判長 山崎 達也
特許庁審判官 仲間 晃
小林 大介
発明の名称 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム  
代理人 特許業務法人高橋・林アンドパートナーズ  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ