• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 全部申し立て 2項進歩性  G06Q
管理番号 1367000
異議申立番号 異議2020-700358  
総通号数 251 
発行国 日本国特許庁(JP) 
公報種別 特許決定公報 
発行日 2020-11-27 
種別 異議の決定 
異議申立日 2020-05-25 
確定日 2020-10-19 
異議申立件数
事件の表示 特許第6611068号発明「企業情報処理装置、企業のイベント予測方法及び予測プログラム」の特許異議申立事件について、次のとおり決定する。 
結論 特許第6611068号の請求項1?10に係る特許を維持する。 
理由 1 手続の経緯
特許第6611068号の請求項1?10に係る特許についての出願は、平成31年2月20日に出願され、令和元年11月8日にその特許権の設定登録がされ、令和元年11月27日に特許掲載公報が発行された。その後、その特許に対し、令和2年5月25日に特許異議申立人株式会社帝国データバンク(以下、「申立人A」という。)が特許異議の申立て(同「申立てA」)、また、令和2年5月26日に特許異議申立人上杉隆一(同「申立人B」)が特許異議の申立て(同「申立てB」)を行った。

2 本件発明
特許第6611068号の請求項1?10の特許に係る発明は、それぞれ、その特許請求の範囲の請求項1?10に記載された事項により特定される次のとおりのものである。

「【請求項1】
複数の期間について収集された、複数の企業に含まれる各企業の複数項目の定量データと各企業の定性情報のそれぞれを分類して数値化した複数項目の定性データと、が格納されたデータベースの前記定量データ及び前記定性データから、特定の項目を読み込んで各企業の属性ベクトルを生成し、かつ、読み込んだ各企業の前記定量データ及び定性データから選択した項目について異なる2つの期間での差分を算出し、各企業の前記属性ベクトルに追加する計算処理部と、
前記定性データに含まれる各企業の実物取引関係を示すデータから、各企業と取引先及び株主とが形成するネットワークのネットワーク統計量を算出して、各企業の属性ベクトルに追加する相関処理部と、
前記定量データ及び定性データから各企業の既出イベントの発生を示すデータを抽出して、各企業の属性ベクトルに追加するイベント抽出部と、
各企業の属性ベクトルを構成するデータに欠損値が存在する場合、前記欠損値を所定の値に置換し、前記欠損値が前記所定の値に置換された前記複数の企業の前記属性ベクトルから、機械学習により学習することで企業の将来のイベントの発生を予測するモデルの学習に用いられる学習用データセットを構築する欠損値処理部と、を備える、
企業情報処理装置。

【請求項2】
前記計算処理部は、前記定量データ及び定性データから選択した項目について、異なる2つの期間での第1の差分を算出し、前記第1の差分の算出に用いたのとは異なる2つの期間での第2の差分を算出し、かつ、前記第1の差分と前記第2の差分との間の第3の差分を算出して、各企業の前記属性ベクトルに追加する、
請求項1に記載の企業情報処理装置。

【請求項3】
前記欠損値処理部は、各企業の属性ベクトルの各項目が欠損値であるかを示す新たな項目のデータを生成し、生成した項目のデータを各企業の前記属性ベクトルに追加する、
請求項1又は2に記載の企業情報処理装置。

【請求項4】
前記学習用データセットを機械学習する機械学習部を更に備え、
前記機械学習部は、前記既出イベントが発生した企業の前記属性ベクトルに第1の重みを付与し、前記既出イベントが発生していない企業の前記属性ベクトルに前記第1の重みよりも小さな第2の重みを付与して、機械学習を行う、
請求項1乃至3のいずれか一項に記載の企業情報処理装置。

【請求項5】
前記既出イベントが発生した企業の数に前記第1の重みを乗じた値と、前記既出イベントが発生していない企業の数に前記第2の重みを乗じた値と、の和は1である、
請求項4に記載の企業情報処理装置。

【請求項6】
前記第1の重みは、前記既出イベントが発生した企業の数に2を乗じた値の逆数であり、
前記第2の重みは、前記既出イベントが発生していない企業の数に2を乗じた値の逆数である、
請求項5に記載の企業情報処理装置。

【請求項7】
前記モデルを用いて企業の将来のイベントの発生を予測する予測処理部を更に有する、
請求項4乃至6のいずれか一項に記載の企業情報処理装置。

【請求項8】
計算処理部によって、複数の期間について収集された、複数の企業に含まれる各企業の複数項目の定量データと各企業の定性情報のそれぞれを分類して数値化した複数項目の定性データと、が格納されたデータベースの前記定量データ及び前記定性データから、特定の項目を読み込んで各企業の属性ベクトルを生成し、かつ、読み込んだ各企業の前記定量データ及び定性データから選択した項目について異なる2つの期間での差分を算出し、各企業の前記属性ベクトルに追加し、
相関処理部によって、前記定性データに含まれる各企業の実物取引関係を示すデータから、各企業と取引先及び株主とが形成するネットワークのネットワーク統計量を算出して、各企業の属性ベクトルに追加し、
イベント抽出部によって、前記定量データ及び定性データから各企業の既出イベントの発生を示すデータを抽出して、各企業の属性ベクトルに追加し、
各企業の属性ベクトルを構成するデータに欠損値が存在する場合、欠損値処理部によって、前記欠損値を所定の値に置換し、前記欠損値が前記所定の値に置換された前記複数の企業の前記属性ベクトルから、機械学習により学習することで企業の将来のイベントの発生を予測するモデルの学習に用いられる学習用データセットを構築し、
予測処理部が、機械学習部による機械学習によって前記学習用データセットを学習した学習済みモデルを用いて、企業の将来のイベントの発生を予測する、
企業のイベント予測方法。

【請求項9】
複数の期間について収集された、複数の企業に含まれる各企業の複数項目の定量データと各企業の定性情報のそれぞれを分類して数値化した複数項目の定性データと、が格納されたデータベースの前記定量データ及び前記定性データから、特定の項目を読み込んで各企業の属性ベクトルを生成し、かつ、読み込んだ各企業の前記定量データ及び定性データから選択した項目について異なる2つの期間での差分を算出し、各企業の前記属性ベクトルに追加する処理と、
前記定性データに含まれる各企業の実物取引関係を示すデータから、各企業と取引先及び株主とが形成するネットワークのネットワーク統計量を算出して、各企業の属性ベクトルに追加する処理と、
前記定量データ及び定性データから各企業の既出イベントの発生を示すデータを抽出して、各企業の属性ベクトルに追加する処理と、
各企業の属性ベクトルを構成するデータに欠損値が存在する場合、前記欠損値を所定の値に置換し、前記欠損値が前記所定の値に置換された前記複数の企業の前記属性ベクトルにより構築される学習用データセットを機械学習により学習した学習済みモデルを用いて、企業の将来のイベントの発生を予測する処理と、をコンピュータに実行させる、
企業のイベント予測プログラム。

【請求項10】
複数の期間について収集された、複数の企業に含まれる各企業の複数項目の定量データと各企業の定性情報のそれぞれを分類して数値化した複数項目の定性データと、が格納されたデータベースの前記定量データ及び前記定性データから、特定の項目を読み込んで各企業の属性ベクトルを生成し、かつ、読み込んだ各企業の前記定量データ及び定性データから選択した項目について異なる2つの期間での差分を算出し、各企業の前記属性ベクトルに追加する処理と、
前記定性データに含まれる各企業の実物取引関係を示すデータから、各企業と取引先及び株主とが形成するネットワークのネットワーク統計量を算出して、各企業の属性ベクトルに追加する処理と、
前記定量データ及び定性データから各企業の既出イベントの発生を示すデータを抽出して、各企業の属性ベクトルに追加する処理と、
各企業の属性ベクトルを構成するデータに欠損値が存在する場合、前記欠損値を所定の値に置換し、前記欠損値が前記所定の値に置換された前記複数の企業の前記属性ベクトルにより構築される学習用データセットを機械学習により学習した学習済みモデルを用いて、企業の将来のイベントの発生を予測する処理と、をコンピュータに実行させる、
企業のイベント予測方法。」

3 申立理由の概要
申立人Aは、主たる証拠として、宮川外2名、「Forecasting Firm Performance with Machine Learning:Evidence from Japanese firm-level data(RIETI Discussion Paper Series 17-E-068」(URL略)の写し(以下「文献1」という。)を、及び、従たる証拠として、三浦、「入出金情報を用いた信用リスク評価」の写し(同「文献2」)、高橋外1名、「大規模データによるデフォルト確率の推定-中小企業信用リスク情報データベースを用いて-」の写し(同「文献3」)、荒川、「AIを活用した信用評価手法の現状とこれから」の写し(同「文献4」)、伊藤外1名、「企業のウェブ情報を用いた取引マッチング支援システムに関する研究」の写し(同「文献5」)を、提出し、請求項1?10に係る特許は特許法第29条第2項の規定に違反してされたものであるから、請求項1?10に係る特許を取り消すべきものである旨主張する。
また、申立人Bは、主たる証拠として、文献1を、及び、従たる証拠として、文献3、特許第6347022号公報(同「文献6」)、特開2018-195137号公報(同「文献7」)を、提出し、請求項1?4、7?10に係る特許は同法第29条第2項の規定に違反してされたものであるから、請求項1?4、7?10に係る特許を取り消すべきものである旨主張する。

4 文献の記載
(1)文献1について
文献1は、2017年5月に電気通信回線を通じて公衆に利用可能となった発明を記載したものであり、次の事項が記載されている。(下線は、当審が付与した。)

ア 「Abstract
The goal of this paper is to forecast future firm performance with machine learning techniques. Using data on over one million Japanese firms with supply-chain linkage information provided by a credit reporting agency, we show high performance in the prediction of exit, sales growth, and profit growth. In particular, our constructed proxies far outperform the credit score assigned by the credit reporting agency based on a detailed survey and interviews of firms. Against such baseline score, our models are able to ex-ante identify 16% of exiting firms (baseline: 11%), 25% of firms experiencing growth in sales (baseline: 8%), and 22% of firms exhibiting positive profit growth (baseline: 13%). The proof of concept of this paper provides practical usage of machine learning methods in firm performance prediction.」
(訳:この論文の目的は機械学習技術を用いて将来の企業活動を予測することである。信用調査会社からもたらされるサプライチェーンのリンク情報を含んだ百万社を超える日本企業のデータを用いて、企業の退出・売上高成長・利益成長の予測が高性能に行えることを示す。特に、我々が計算した指標値は信用調査会社が企業に対する詳細な調査とインタビューに基づいて割り付けた信用スコアより遙かに性能が優れている。このような基準値となるスコアに対して、我々のモデルは、退出企業の16%(基準値11%)、売上高成長企業の25%(基準値8%)、利益がプラスに成長する企業の22%(基準値13%)を事前特定することができる。この論文における概念検証は、企業活動予測における機械学習手法の実務的な有用性をもたらす。)

イ 「1 Introduction
・・・
In addition to proving raw information such as financial statements, they typically create a score that summarizes the overall performance of the firm. These scores are typically constructed from both observable firm characteristics and financial statements (i.e. “hard” information) and in-depth interviews based on owner characteristics, reputation, and growth opportunity (i.e. “soft” information).
・・・
A recent revolution of machine learning techniques opens up a scope to tackle such a problem possibly more accurately, systematically and in a non-arbitrary manner. Machine learning is the study of efficient and accurate prediction using models which summarize potential sets of predictors. It is used in different contexts such as the prediction of crime in a specific area, mechanical failure in a plant, and weather forecasts.
The goal of this paper is to apply machine learning techniques to predict various future firm performance measures (i.e., firm exit, sales growth, and profit growth) and compare their predictive power with the score assigned by the credit reporting agency. Toward this end, we utilize the firm-level data from TSR in Japan, which consist of a subset of firm characteristics, supply chain linkage information, as well as its score assigned by the TSR, of nearly all firms that TSR covers in 2006, 2011 and 2014.
We find that, although the score constructed by TSR has reasonably good predictive performance, particularly for exit prediction, combining firm-level characteristics to the score with machine learning far out-performs the score. In particular, against such a baseline score, our models are able to ex-ante identify 16% of exiting firms (baseline: 11%), 25% of firms experiencing growth in sales (baseline: 8%), and 22% of firms exhibiting positive profit growth (baseline: 13%). These results suggest the usefulness of machine learning methods in firm performance prediction.」
(訳:1 序論
・・・
財務諸表などの生データの正しさを証明することに加えて、信用調査会社は典型的には企業の活動の全容をまとめたスコアを作成する。これらのスコアは典型的には、観測可能な企業特性と財務諸表(すなわち「ハードな」情報)と、経営者の特徴・評判・成長機会(すなわち「ソフトな情報」)に基づく綿密なインタビューとの両方から構成される。
・・・
機械学習技術の近年の革命は、このような問題に対して、場合によってはより正確で系統的に、恣意性のない方法で取り組むための視野を開いている。機械学習は、予測変数の潜在的な集合を集約したモデルを用いて効率的で正確な予測を行う研究である。機械学習は特定の地域での犯罪予測・プラントでの機械的な故障・天気予報など相異なる文脈で利用されている。
この論文の目的は機械学習技術をさまざまな将来の企業活動の指標(すなわち企業の退出・売上高成長・利益成長)に適用し、その予測力を信用調査会社が付与したスコアと比較することである。この目的のために、我々は日本のTSRによる、企業特性・サプライチェーンのリンク情報からなる、TSRがカバーするほぼ全ての企業に対する2006年、2011年および2014年の企業レベルデータと、それらの企業にTSRが付与したスコアのデータを用いた。
TSRが構築したスコアはかなりよい予測実績を示すにもかかわらず、特に企業の退出については、企業レベルの特徴と機械学習によるスコアとの組み合わせが、TSRのスコアよりはるかに優れた性能を示す。特に、このような基準値となるスコアに対して、我々のモデルは退出企業の16%(基準値11%)、売上高成長企業の25%(基準値8%)、利益がプラスに成長する企業の22%(基準値13%)を事前特定することができる。これらの結果は、企業活動予測における機械学習手法の有用性を示唆している。)

ウ 「2.2 Data
In this section, we will go over the data we use in the present study. All data is obtained from TSR through the support of Research Institute of Economy, Trade and Industry (RIETI), which is a governmental research institute affiliated with Japanese Ministry of Economy, Trade and Industry.」
(訳:2.2 データ
この節では、本研究で我々が利用するデータについて論じる。全てのデータは、経済産業省に属する政府系研究所である経済産業研究所(RIETI)の助力を通してTSRから取得した。)

エ 「2.2.1 Overview
Our main data source is a panel of Japanese firm data accounting for firms’ basic performance information (e.g., sales, number of employees, stated capital, and profit) as well as basic characteristics including company owner characteristics, precise geographic location, firm age, etc., for 2006, 2011, and 2014. For some variables (e.g. sales, profit, dividend), the data records the information in the preceding year. The data records around 800,000 firms in 2006 and reaches nearly 1,700,000 firms in 2014.
In addition to the firm-level characteristics, the dataset also includes linked firm-firm pair-level data accounting for firms’ supply chain network. As discussed in, for example, Acemoglu et al.(2015), which suggests firm-level shocks are transmitted through a network of interconnections in the economy, it is reasonable to presume that this supply chain network information has predictive power.」
(訳:2.2.1 概要
我々の主要なデータ源は、2006年、2011年および2014年の企業の基本的な活動情報(例えば売上高・従業員数・資本金・利益)と、経営者の特徴・厳密な地理的所在地・企業年齢などの基本的な特徴を説明する、日本企業のパネルデータである。いくつかの変数(例えば売上高・利益・配当)については、過年の情報も記載されている。2006年については約800,000社の記録があり、2014年にはほとんど1,700,000社に至っている。
企業レベルのデータに加えて、データセットには企業のサプライチェーンネットワークを説明する企業ペアレベルのリンクデータが含まれている。例えば、経済活動における相互連結したネットワークを通して企業レベルのショックが伝達されることを示したAcemoglu et al.(2015)で議論されているように、サプライチェーンネットワーク情報が予測力を持つことを仮定するのはもっともらしいと思われる。)

オ 「2.2.2 Firm Performance Indicators
We consider three firm performance indicators to be predicted: firm exit, sales growth, and profit growth. Each outcome variable is defined for two time intervals; from 2006 to 2011, and 2011 to 2014. We use information from 2006 to predict outcomes defined for 2006 to 2011,and information from 2011 to predict outcomes for 2011 to 2014.
Firm Exit
We define firm exit in any subsequent panel periods if firms exited the market for the following four reasons reported by TSR: bankruptcies, closure, dissolution, and suspension.
Sales Growth
To characterize firms which exhibit high sales growth relative to other firms in the same industry, we prepare a dummy variable that takes 1 if the sales growth in the subsequent panel periods exceeds the average plus one standard deviation within the same 2-digit industry.
Profit Growth
We prepare a dummy variable that takes 1 if the profit growth in the subsequent panel periods exceeds the average plus one standard deviation within the same 2-digit industry. In this analysis, we restrict our data to firms which realize positive profits.」
(訳:2.2.2 企業業績の指標
我々は予測されるべき3つの企業活動の指標を考察する。企業退出・売上高成長・利益成長である。それぞれの結果変数は2つの時間間隔について定義した;2006年から2011年の時間間隔と2011年から2014年の時間間隔である。我々は2006年から2011年の結果を予測するために2006年からの情報を、2011年から2014年の結果を予測するために2011年からの情報を利用する。
企業退出
我々はある時点以降における企業の退出を、TSRによって報告される4つの理由(倒産、閉鎖、解散、操業停止)によって企業が市場から退出したかどうかで定義する。
売上高成長
同じ業種の他の企業に比べて高い売上高成長を示す企業を特徴付けるために、ダミー変数を導入した。このダミー変数は、ある時点以降に同じ中分類の企業の中で売上高成長が平均値+1標準偏差を超える場合に値1をとる。
利益成長
ある時点以降に同じ中分類の企業の中で利益成長が平均値+1標準偏差を超える場合に値1をとるダミー変数を準備した。この分析では、利益が正である企業にデータを制限した。)

カ 「2.2.3 Predictors
We use four categories of predictors to predict the firm performance measures described in the previous subsection: (1) the score constructed by TSR (fscore), (2) firms’ own characteristics, (3) geography and industry-related variables, and (4) supply-chain network related variables.Here we overview the variables categorized in each group below. The Appendix 1 describes the full list of variables.」
(訳:2.2.3 予測変数
我々は前節で述べた企業活動の指標を予測するために、4カテゴリーに分けられる予測指標を用いる:(1)TSRが構築したスコア(fスコア)(2)企業特性(3)産業情報と地理情報(4)サプライチェーンに関連した変数。ここでそれぞれのグループに区分された変数の概要を述べる。附録1に変数の完全なリストを挙げる。)

キ 「(1) Solvency Score
The score (fscore) takes values between 0 and 100. The number is computed as the sum of the four sub-scores accounting for (i) the ability of owner (max: 20 points) based on the business attitude, experience, their asset condition, and so on, (ii) the growth possibility (max: 25 points) based on past sales growth, the growth of profit, the characteristics of products, and so on, (iii) stability (max: 45 points) based on firm age, stated-capital, financial statement information,room of collateral provision, real and financial transaction relationships, and so on, and (iv) reputation (max 10 points) based on the level of disclosure and overall reputation. We only have access to the fscore, but not the decomposition of each component・・・」
(訳:(1)支払い能力スコア
スコア(fスコア)は0から100までの値をとる。数値は4つの部分スコアの和として計算される。(i)業務態度・経験・資産状況などに基づいた経営者の能力(最大20ポイント)(ii)過去の売上高成長・利益成長・製品特性などに基づいた成長の機会(最大25ポイント)(iii)企業年齢・資本金・財務諸表情報・担保提供の余地・実取引および金融取引関係などに基づいた安定度(最大45ポイント)(iv)情報開示レベルと全体的な評判に基づいた評判(最大10ポイント)。我々はfスコアにのみアクセスしており、fスコアを分解した各成分にはアクセスしていない。・・・)

ク 「(2) Own-Firm Characteristics
As predictors accounting for firms’ own characteristics, we use the information stored in financial statements and firms’ attributes. The former consists of firm size measured by their sales and its change, their profit (loss or not) and its change, the number of employees, their stated capital, and the status of dividend payment and its change. The latter consists of firm age, owner age, the number of establishments, and their listed status.」
(訳:(2)企業特性
企業特性を説明する予測変数として、我々は財務諸表ならびに企業の属性の情報を用いる。前者(財務諸表情報)は売上高とその変化・利益とその変化・従業者数・資本金・配当金とその変化で測った企業規模からなる。後者(企業属性)は企業年齢・経営者年齢・事業所数・上場状況からなる。)

ケ 「(3) Industry and Geographic Information
As predictors accounting for the industry and area which firms belong to, we set up the following two groups of variables. First, we construct the two variables measuring the average sales growth of firms located in the same city as the targeted (i.e., we compute a score for) firms as well as the average sales growth of firms belonging to the same industry classified in the 2-digit level. Second, we also employ dummy variables representing the 2-digit industry classification as well as dummy variables representing the large classification used in Japan Standard Industry Classification.」
(訳:(3)産業情報と地理的情報
企業が属する産業と地域を説明する予測変数として、我々は以下の2つの変数のグループをセットする。まず、(スコアを計算する)ターゲットとなる企業と同じ都市に所在する企業の平均売上高成長率とターゲットとなる企業と同じ中分類に所在する企業の平均売上高成長率とを測定する2つの変数を構築する。次に、日本標準産業分類の大分類と中分類とを表すダミー変数を用いる。)

コ 「(4) Supply-Chain Linkage Information
As predictors accounting for the supply chain network, we construct the following two groups of variables. First, we compute widely used network metrics for each firm by using the supply chain network information. The metrics consist of degree centrality, eigenvector centrality, egonet eigenvalue, co-transaction, and the number of direct (i.e., customers and suppliers) and indirect (i.e., suppliers’ suppliers, suppliers’ customers, customers’ customers, and customers’ suppliers) transaction partners. Second, we construct a large number of variables accounting for the characteristics of transaction partners. To summarize this information, we employ an average, maximum, minimum and the sum of various attributes associated with transaction partners. Note that while the network metrics cover both the direct and indirect transaction partners, the transaction partners’ characteristics only consider the direct transaction partners.・・・」
(訳:(4)サプライチェーンのリンク情報
サプライチェーンネットワークを説明する予測変数として、我々は以下の2つの変数のグループを構築する。まず、サプライチェーンネットワークの情報を用いて、個々の企業に対して広く使われているネットワーク指標を計算する。指標は次数中心性・固有ベクトル中心性・エゴネット固有値・共通取引・直接の取引先(すなわち、仕入先および販売先)の数・間接的な取引先(すなわち、仕入先の仕入先・仕入先の販売先・販売先の仕入先・販売先の販売先)の数からなる。つぎに我々は取引先の特徴を説明する変数を多数作成する。これらの情報を集約するために、取引相手に関するさまざまな属性の平均・最大値・最小値・総和を用いる。ネットワーク指標は直接の取引先と間接の取引先の両方をカバーしているのに対し、取引先の特徴については直接の取引相手のみを考察していることに注意。・・・

サ 「3 Method
We utilize state-of-the-art machine learning methods for developing our prediction model. Our particular problem of predicting relatively rare firm exit events (which occur with 7% probability) falls in to the class of “imbalanced label prediction” tasks in computer science.Following the literature, we apply weighted random forest, a minority-class oversampling
method.
3.1 Weighted Random Forest
Random forests models aggregate many individual decision tree models, each trained on a randomly selected sample from the training data. Particularly for predicting rare events, Chen et al. (2004) develop an extension of random forest, called weighted random forest. Intuitively, the method weighs data corresponding to minority event (e.g. exit) much more heavily than that corresponding to the majority event (e.g. non-exit).
・・・
3.3 Measuring Prediction Performance
In our baseline exercise, we train models with the realization of outcome variables from 2006 to 2011 using the information available at 2006, and conduct out-of-sample prediction of the realization of outcome variables from 2011 to 2014 using the information available at 2011.
We utilize the ROC curve to evaluate the predictive performance of the model.・・・」
(訳:3 手法
我々は予測モデルを作成するために、最先端の機械学習技術を用いる。相対的に稀なイベントである企業退出(確率7%で起こる)の予測という特定の問題は、計算機科学での「不均衡ラベル予測」という課題のクラスに帰着する。文献に従い、我々は重み付きランダムフォレスト、小数派クラスオーバーサンプリング法を適用する。
3.1 重み付きランダムフォレスト
ランダムフォレストモデルは、訓練データからランダムに選ばれたサンプルによって訓練された、それぞれ独立な多数の決定木モデルを集めたものである。特に稀なイベントを予言するために、Chenら(2004)は重み付きランダムフォレストと呼ばれる、ランダムフォレストの拡張版を発展させた。直感的には、Chenらの手法は少数イベント(すなわち退出)に対応するデータに対して、多数イベント(すなわち非退出)に比べてはるかに重く重みを付ける手法である。
・・・
3.3 予測実績の測定
我々の基準とする実装では、2006年時点で手に入れられる情報を用いて2006年から2011年の結果変数の実現値に関するモデルを訓練し、2011年時点で手に入れられる情報を用いて2011年から2014年の結果変数の実現値に関するサンプル外予測を行う。
モデルの予測実績の評価のためにROC曲線を用いる。・・・)

シ 「4 Results
Figure 1 shows the four ROC curves in the case of exit prediction. We evaluate four models. The first model uses only fscore while the second model additionally contains firms’ own characteristics selected as predictors. The third model further includes the geography- and industry-specific variables selected as predictors. The fourth model includes all the selected variables including the ones in network variables. All ROC curves are based on the out-of sample prediction of the exit from 2011 to 2014, using the exit from 2006 to 2011 as a training data.・・・」
(訳:4 結果
図1に企業退出の予測の場合の4つのROC曲線を示す。我々は4つのモデルを評価する。1番目のモデルはfスコアのみを用いるのに対し、2番目のモデルは予測変数として選ばれた企業特性を追加的に含んでいる。3番目のモデルは予測変数として選ばれた産業情報と地理的情報をさらに含んでいる。4番目のモデルはネットワーク変数を含む、選ばれた変数を全て含んでいる。全てのROC曲線は、2006年から2011年の企業退出を訓練データとして用いた2011年から2014年の企業退出のサンプル外予測に基づいている。)

ス 以上の記載によれば、「機械学習」によって「企業退出の予測」に係る「4番目のモデル」の「訓練」及び「サンプル外予測」を行う企業情報の処理装置について、特許出願前に、以下の発明(以下、「引用発明」という。)が電子通信回線を通じて公衆に利用可能となったものと認められる。

3番目のモデルの予測変数である、fスコア、企業特性から選ばれた変数及び産業情報と地理的情報から選ばれた変数とともに、3番目のモデルの予測変数でない、ネットワーク変数から選ばれた変数をも予測変数として、企業退出等を機械学習により予測するためのモデルに係る企業情報の処理装置であって、(ア、イ、サ、シ)
予測変数は、2006年、2011年および2014年の企業の基本的な活動情報(例えば売上高・従業員数・資本金・利益)と、経営者の特徴・厳密な地理的所在地・企業年齢などの基本的な特徴を説明する、日本企業のパネルデータを訓練データのための主要なデータ源とするものであり、いくつかのデータ(例えば売上高・利益・配当)は、過年の情報を記載したものであり、(ウ、エ、カ)
fスコアは、(i)業務態度・経験・資産状況などに基づいた経営者の能力(最大20ポイント)(ii)過去の売上高成長・利益成長・製品特性などに基づいた成長の機会(最大25ポイント)(iii)企業年齢・資本金・財務諸表情報・担保提供の余地・実取引および金融取引関係などに基づいた安定度(最大45ポイント)(iv)情報開示レベルと全体的な評判に基づいた評判(最大10ポイント)の4つの部分スコアの和として計算されるものであって、fスコアを分解した各成分にはアクセスされないものであり(キ)、
企業特性を説明する予測変数は、売上高とその変化、利益とその変化等からなる財務諸表情報と企業年齢・経営者年齢等からなる企業属性情報であり(ク)、
企業が属する産業と地域を説明する予測変数は、ターゲットとなる企業と同じ都市に所在する企業の平均売上高成長率とターゲットとなる企業と同じ中分類に所在する企業の平均売上高成長率とを測定する2つの変数及び日本標準産業分類の大分類と中分類とを表すダミー変数であり(ク)、
ネットワーク変数、つまり、サプライチェーンネットワークを説明する予測変数は、企業のサプライチェーンネットワークを説明する企業ペアレベルのリンクデータであって、次数中心性・固有ベクトル中心性・エゴネット固有値・共通取引・直接の取引先(すなわち、仕入先および販売先)の数・間接的な取引先(すなわち、仕入先の仕入先・仕入先の販売先・販売先の仕入先・販売先の販売先)の数からなる、個々の企業に対して広く使われているネットワーク指標、及び、取引相手に関するさまざまな属性の平均・最大値・最小値・総和等の取引先の特徴を説明する多数の変数であり(ケ、コ、シ)、
企業退出・売上高成長・利益成長の予測されるべき3つの企業活動の指標である結果変数について、2006年時点で手に入れられる情報を用いて2006年から2011年の結果変数の実現値に関するモデルを訓練し、2011年時点で手に入れられる情報を用いて2011年から2014年の結果変数の実現値に関するサンプル外予測を行う(オ、サ)、
企業情報の処理装置。

(2)文献2?7について:略

5 当審の判断
(1)請求項1に係る発明について
ア 対比
請求項1に係る発明(以下「本件発明」という。)と引用発明とを対比する。

(ア)引用発明の「企業特性を説明する予測変数」のうち、「売上高とその変化、利益とその変化等からなる財務諸表情報」は、本件発明の「企業」の「複数項目」の「定量データ」に相当し、この定量データは、「2006年、2011年および2014年」という「複数の期間」について「収集された」ものであるといえる。
また、引用発明の「企業特性を説明する予測変数」のうち「企業年齢・経営者年齢等からなる企業属性情報」と「企業が属する産業と地域を説明する予測変数」は、企業の定性情報のそれぞれを分類して数値化したものを含むものであり、本件発明の「企業」の「複数項目」の「定性データ」に相当する。
そして、引用発明では、データベースに格納された企業特性から選ばれた変数及びデータベースに格納された産業情報と地理的情報から選ばれた変数を予測変数とするところ、この引用発明の「予測変数」は、企業の属性を示す複数の項目の値を示すベクトル変数といえるから、「企業」の「属性ベクトル」に相当する。
以上を踏まえると、本件発明と引用発明とは、「複数の期間について収集された、複数の企業に含まれる各企業の複数項目の定量データと各企業の定性情報のそれぞれを分類して数値化した複数項目の定性データと、が格納されたデータベースの前記定量データ及び前記定性データから、特定の項目を読み込んで各企業の属性ベクトルを生成」する「計算処理部」を備える点で共通するといえる。

なお、引用発明では、いくつかのデータ(例えば売上高・利益・配当)は「過年の情報の記載」である「売上高の変化」や「利益の変化」を含む「財務諸表情報」であって、属性ベクトルを生成すべく読み込んだ「定量データ及び定性データから選択した項目」について「異なる2つの期間での差分」を算出するものでない。よって、引用発明は、本件発明と異なり、「読み込んだ各企業の前記定量データ及び定性データから選択した項目について異なる2つの期間での差分を算出し、各企業の前記属性ベクトルに追加」するものでないから、この点は相違点(相違点1)となる。

(イ)引用発明の「次数中心性・固有ベクトル中心性」は、本件発明の「ネットワーク統計量」に相当する。そして、引用発明の「企業のサプライチェーン」は、「株主」を含まないものの、「企業」と「取引先」とが形成するネットワークであって、さらに、企業の「取引先」は「企業年齢・経営者年齢等からなる企業属性情報」に含まれうるものであるから、引用発明における「ネットワーク統計量」が「企業のサプライチェーンネットワークを説明する企業ペアレベルのリンクデータ」であることは、ネットワーク統計量が「定性データに含まれる各企業の実物取引関係を示すデータ」から「算出」されたものであることに相当する。
以上を踏まえると、本件発明と引用発明とは、「前記定性データに含まれる各企業の実物取引関係を示すデータから、ネットワーク統計量を算出して各企業の属性ベクトルに追加」する「相関処理部」を備える点で共通するといえる。

(ウ)引用発明の「企業退出・売上高成長・利益成長」は、本件発明の「企業」の「イベント」に相当し、引用発明におけるモデルの訓練に用いられる「企業退出・売上高成長・利益成長の予測されるべき3つの企業活動の指標である結果変数」の「実現値」は、本件発明の「企業の既出イベントの発生を示すデータ」に相当する。また、引用発明のイベントのうちの「利益成長」が「利益」という企業の定量データと「企業」の「中分類」という企業の定性データとから抽出されることは、本件発明の「既出イベント」が「前記定量データ及び定性データ」から「抽出されることに相当するといえる。
このことを踏まえると、本件発明と引用発明とは、「前記定量データ及び定性データから各企業の既出イベントの発生を示すデータを抽出して、各企業の属性ベクトルに追加」する「イベント抽出部」を備える点で一致するといえる。

(エ)引用発明は、機械学習により予測するためのモデルに係る企業情報の処理装置であるから、本件発明と引用発明とは、「複数の企業の属性ベクトルから、機械学習により学習することで企業の将来のイベントの発生を予測するモデルの学習に用いられる学習用データセットを構築」する「処理部」を備える「企業情報処理装置」である点で共通するといえる。

(オ)してみると、両発明は、

複数の期間について収集された、複数の企業に含まれる各企業の複数項目の定量データと各企業の定性情報のそれぞれを分類して数値化した複数項目の定性データと、が格納されたデータベースの前記定量データ及び前記定性データから、特定の項目を読み込んで各企業の属性ベクトルを生成する計算処理部と、
前記定性データに含まれる各企業の実物取引関係を示すデータから、ネットワーク統計量を算出して、各企業の属性ベクトルに追加する相関処理部と、
前記定量データ及び定性データから各企業の既出イベントの発生を示すデータを抽出して、各企業の属性ベクトルに追加するイベント抽出部と、
と、
複数の企業の属性ベクトルから、機械学習により学習することで企業の将来のイベントの発生を予測するモデルの学習に用いられる学習用データセットを構築する処理部と、を備える
企業情報処理装置

で一致する。

(オ)そして、以下の点で相違する。

(相違点1)
本件発明では、計算処理部が「読み込んだ各企業の前記定量データ及び定性データから選択した項目について異なる2つの期間での差分を算出し、各企業の前記属性ベクトルに追加」するのに対し、引用発明では、いくつかのデータ(例えば売上高・利益・配当)は「過年の情報の記載」である「売上高の変化」や「利益の変化」を含む「財務諸表情報」を用い、「読み込んだ各企業の前記定量データ及び定性データから選択した項目について異なる2つの期間での差分を算出し、各企業の前記属性ベクトルに追加」するものでない点

(相違点2)
本件発明では、相関処理部が算出するネットワーク統計量が「企業と取引先及び株主とが形成するネットワーク」のものであるのに対し、引用発明では、サプライチェーンのネットワーク統計量であって、「企業と取引先及び株主とが形成するネットワーク」のものではない点

(相違点3)
本件発明の処理部は、「各企業の属性ベクトルを構成するデータに欠損値が存在する場合、前記欠損値を所定の値に置換」し学習用データの構築のための企業の属性ベクトルが「前記欠損値が前記所定の値に置換された」ものである「欠損値処理部」であるのに対し、引用発明の処理部は、各企業の属性ベクトルを構成するデータに欠損値が存在する場合の処理を行うものでなく「欠損値処理部」でない点

(カ)申立人Bは、上記相違点1は一致点であると主張しているが、(ア)のなお書きで示したとおり、この点は、相違点となる。
申立人Bが主張の根拠として示した文献1の記載(附録1の記載:摘記省略)は、「企業特性」を示す「変数」の「リスト」(「4(1)カ」)の一部であり、その「売上高の対数の差(2004年と2005年の売上高の対数の差、2009年と2010年の売上高の対数の差)」は、引用発明の「財務諸表情報」に含まれる「売上高の変化」や「利益の変化」等を示すものである。この「リスト」の記載においても、「売上高の対数」についての2006年及び2011年のそれぞれのデータは、それぞれその前年(2005年、2010年)のものであるとされているから、文献1において「売上高の対数」についての2004年及び2009年のデータは読み込まれていない。このことを踏まえれば、この「リスト」の記載における「売上高の対数の差」が読み込まれた「売上高の対数」の「差分」でないことは、明らかである。

相違点の判断
(ア)事案に鑑み、相違点2について、検討する。
文献1のネットワーク統計量は、「サプライチェーンネットワーク」についてのものであり、文献1はこのような「サプライチェーンネットワーク」についてのネットワーク統計量を予測モデルの変数として採用することで予測精度が高まることを示した文献である。このことに鑑みれば、文献1において、「サプライチェーンネットワーク」についてのネットワーク統計量を資本関係を含むネットワークのようなサプライチェーン以外のネットワークについてのものに変更することは、困難である。
よって、相違点2について、引用発明に基づいて当業者が容易に想到するということはできない。

(イ)この点、申立人Aは、「株主」が「企業の盛衰に影響を及ぼす存在という意味においては取引先と同列」であるとして、「株主」に関するネットワーク統計量を追加することは当業者の設計的事項である旨を主張している。また、申立人Bは、本件発明の「各企業と取引先及び株主」と文献1の「各企業及び取引先」とは同義であり、また、仮にこれらが主体として異なるとしても、甲3記載事項により、文献1の「各企業及び取引先」を「各企業と取引先及び株主」と変更することは、容易想到である旨主張している。
しかし、本件発明において「株主」が「取引先」と区別されていることは、特許請求の範囲の文言上明らかであり、また、上記のとおり、文献1は「サプライチェーンネットワーク」についてのネットワーク統計量を予測モデルの変数として採用することで予測精度が高まることを示した文献であって、このネットワーク統計量を「株主」が示す資本関係のような「サプライチェーン以外のネットワーク」のものに変更することは、困難である。
よって、いずれの申立人の主張も、採用することができない。

ウ 小括
以上のとおり、相違点2について当業者が容易に想到するということはできないから、他の相違点及び他の文献(文献2?7)について検討するまでもなく、請求項1に係る発明は、文献1に記載された発明に基いて当業者が容易になし得るものではない。

(2)請求項2?10に係る発明について
請求項2?7に係る発明は、請求項1に係る発明にさらに技術的事項を追加したものであり、請求項8、9、10は、いずれも請求項1に係る発明に対応する技術的事項を実質的に含むものといえる。
よって、上記(1)に示した理由と同様の理由により、請求項2?10に係る発明は、文献1に記載された発明に基いて当業者が容易になし得るものではない。

6 むすび
したがって、特許異議の申立ての理由及び証拠によっては、請求項1?10に係る特許を取り消すことはできない。
また、他に請求項1?10に係る特許を取り消すべき理由を発見しない。
よって、結論のとおり決定する。
 
異議決定日 2020-10-07 
出願番号 特願2019-28276(P2019-28276)
審決分類 P 1 651・ 121- Y (G06Q)
最終処分 維持  
前審関与審査官 塩田 徳彦  
特許庁審判長 渡邊 聡
特許庁審判官 松田 直也
相崎 裕恒
登録日 2019-11-08 
登録番号 特許第6611068号(P6611068)
権利者 国立大学法人一橋大学 株式会社東京商工リサーチ
発明の名称 企業情報処理装置、企業のイベント予測方法及び予測プログラム  
代理人 家入 健  
代理人 家入 健  
代理人 奥田 弘之  
代理人 奥田 規之  
  • この表をプリントする
事前申し込み無料!情報収集目的の方もぜひいらしてください!
すごい知財サービス EXPO 2021

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ