• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない。 G06Q
審判 査定不服 5項独立特許用件 特許、登録しない。 G06Q
管理番号 1392553
総通号数 13 
発行国 JP 
公報種別 特許審決公報 
発行日 2023-01-27 
種別 拒絶査定不服の審決 
審判請求日 2021-06-15 
確定日 2022-12-01 
事件の表示 特願2017− 79544「広告形態決定装置、広告形態決定方法、及びプログラム」拒絶査定不服審判事件〔平成30年11月15日出願公開、特開2018−180932〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 第1 経緯
1.手続
本願は、平成29年4月13日の出願であって、手続の概要は以下のとおりである。

拒絶理由通知 :令和 2年12月16日(起案日)
手続補正・意見書 :令和 3年 2月26日
拒絶査定 :令和 3年 3月10日(起案日)
拒絶査定不服審判請求 :令和 3年 6月15日
手続補正 :令和 3年 6月15日

2.査定
原審での査定の理由は、概略、以下のとおりである。

進歩性)本願の請求項1〜6に係る発明(令和3年2月26日提出の手続補正書による)は、下記引用文献に記載された発明および周知技術に基づいて当業者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により、特許を受けることができない。

引用文献1.米国特許出願公開第2016/0350802号明細書

第2 補正却下の決定
令和3年6月15日にされた手続補正(以下、「本件補正」という。)について次のとおり決定する。

《結論》
令和3年6月15日にされた手続補正を却下する。

《理由》
1.本件補正の内容
本件補正は、補正前の請求項5の記載を補正後の請求項5の記載とする以下のとおりの補正事項を含むものである。

(補正前)
【請求項5】
コンピュータが
広告対象が共通し且つ広告デザインの異なる複数の広告を配信した際のクリック実績を取得し、
取得されたクリック実績に基づいて、前記広告デザインごとのクリックされやすさを表すベータ分布をそれぞれ生成し、
前記ベータ分布のパラメータαおよびβを、更新前のパラメータαおよびβに、直近の所定時間内のクリック実績に基づく成分を反映させて更新する、
広告形態決定方法。

(補正後:下線は補正箇所)
【請求項5】
コンピュータが
広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告を配信した際のクリック実績を取得し、
取得されたクリック実績に基づいて、前記広告デザインごとのクリックされやすさを表すベータ分布をそれぞれ生成し、
前記ベータ分布のパラメータαおよびβを、更新前のパラメータαおよびβに、直近の所定時間内のクリック実績に基づく成分を反映させて更新する、
広告形態決定方法。

2.補正の適否
(2−1)補正の範囲・単一性
本件補正は、願書に最初に添付した明細書の記載に基づくものであり、願書に最初に添付した明細書又は図面に記載した事項の範囲内においてする補正である。
また、以下の(2−2)で検討するように、補正後の特許請求の範囲に記載される事項により特定される発明が、補正前の発明と単一性を満たすことは明らかである。

(2−2)補正の目的
a)上記補正事項は、補正前の請求項5の「広告対象が共通し且つ広告デザインの」の構成について、本件補正により「広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが」との記載とすることで、「広告対象」の構成について、「広告依頼主から入稿された内容である広告対象」との特定事項を有するように補正(以下、補正事項1という。)し、「広告デザイン」の構成について、「前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザイン」との特定事項を有するように補正(以下、補正事項2という。)したものである。
これは、補正事項1により「広告対象」の構成について、「広告依頼主から入稿された内容である」という限定事項を付加し、補正事項2により、「広告デザイン」の構成について、「前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた」いう限定事項を付加した補正であるといえる。
したがって、本件補正は、補正前の請求項5に係る発明を特定するために必要な事項を限定するものであって、かつ、補正の前後において発明の産業上の利用分野及び解決しようとする課題は同一であるから、本件補正は、特許法第17条の2第5項第2号に掲げる、特許請求の範囲の減縮に該当する補正事項を含んでいると認められる。

(2−3)独立特許要件
そこで、以下、上記補正後の請求項5に係る発明が独立特許要件を満たすか否かについて検討する。

(I)補正後の請求項5に記載された発明
本件補正後の請求項5に記載された発明(以下、「補正後発明」という。)は、以下のとおりである。((A)ないし(E)は当審において付与した。以下「構成要件(A)」等として引用する。)
【請求項5】
(A)コンピュータが
(B)広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告を配信した際のクリック実績を取得し、
(C)取得されたクリック実績に基づいて、前記広告デザインごとのクリックされやすさを表すベータ分布をそれぞれ生成し、
(D)前記ベータ分布のパラメータαおよびβを、更新前のパラメータαおよびβに、直近の所定時間内のクリック実績に基づく成分を反映させて更新する、
(E)広告形態決定方法。

(II)引用文献の記載事項及び引用発明
原査定の拒絶の理由に引用された刊行物である米国特許出願公開第2016/0350802号明細書(以下「引用文献1」という。)には、図面と共に次に掲げる事項が記載されている。

「 1 . A computer-implemented method comprising:
determining a promotion for a product, the promotion being retrievable from a promotion database and provideable for display to a user;
calculating for the promotion a posterior distribution of a user-action probability reflecting estimates for a user response to a display of the promotion for the product on a computing device of the user;
determining the posterior distribution as collapsing beyond a certain threshold;
responsive to determining the posterior distribution as collapsing, calculating, using a set of formulas, an uncollapsed posterior distribution of the user-action probability reflecting modified estimates for the user response to the display of the promotion for the product on a computing device of the user, the set of formulas being adapted to prevent the uncollapsed posterior distribution from collapsing beyond the certain threshold;
storing the uncollapsed posterior distribution of the user-action probability in a response database;and
determining whether to select the promotion from the promotion database for display on a computing device of the user based on the modified estimates for the user response to the display of the promotion for the product on a computing device of the user.」(請求の範囲1)
(当審訳)
コンピュータにより実施される方法であって、
製品に関するプロモーションを決定することであって、プロモーションはプロモーションデータベースから検索すること及びユーザのディスプレイに提供することが可能であって、
ユーザのコンピュータデバイスに、商品のためのプロモーションの表示を行うことに関して、プロモーションのために、ユーザ応答のための推定値を反映したユーザアクションの可能性の事後分布を計算することと、
ある閾値を越えたところで崩壊するように事後分布を決定し、
計算し、公式のセットを使用して、崩壊するように事後分布を決定するように応答し、事後分布は、ユーザのコンピュータデバイスへの商品のプロモーションのための表示に対するユーザの応答による、更新した推定値を反映したユーザアクションの可能性の崩壊していない事後分布であり、公式のセットは、崩壊していない事後分布が、あるしきい値を超えて崩壊するのを阻止するために適応された公式のセットであり、
ユーザアクションの可能性の崩壊していない事後分布を応答データベースに記憶し、
ユーザのコンピュータデバイス上の、商品のためのプロモーションの表示によるユーザ応答により更新された推定値に基づいて、ユーザのコンピュータデバイスに表示するために、プロモーションデータベースからプロモーションを選択すべきかどうか決定する。

[0004]A developer of a website is often faced with the decision of which version of an advertisement (ad) to place on a webpage. Suppose, there are two versions of the ad, a red version A and a blue version B. The developer wishes to place the version of the ad that will garner the most clicks, but does not know in advance which version that is. The traditional approach is to run an A/B test: Each time the page is served, a random choice is made about whether to display the red version or the blue version of the ad, with a 50/50 chance of either version being displayed. The A/B test proceeds for a period of time, during which time the click-through rate (CTR) of each of the versions is measured. Once the A/B test is complete, the version of the ad with the highest measured CTR is displayed thereafter.
[0005]But questions may still remain: Was the A/B test run for a sufficient period of time to acquire enough data to make a confident measurement of the click-through rate of the ads? With insufficient data, random variation in the click-through rates can result in the inferior ad being chosen over the superior one, a decision which will negatively impact future performance. On the other hand, another question that may arise: Was the A/B test run for too long a period? Because the superior and the inferior ads are shown during the A/B test, pages served with the inferior ad can result in missed clicks. This is what motivates the name “regret” that is given to performance measures of reinforcement learning algorithms. A further question may also be raised: What if the click-through rate varies over time? Suppose that the blue ad comes out on top in an A/B test that was run in June. If the designer runs the blue ad for the rest of the year, there may be opportunity costs associated with potentially higher click rates for the red ad in December. This leads to further questions: Should A/B tests be run periodically? And if yes, then how often? How long? Existing advertisement selection procedures fail to provide optimal solutions to these questions.
SUMMARY
[0006]According to one innovative aspect of the subject matter described in this disclosure, a method may include determining a promotion for a product, the promotion being retrievable from a promotion database and provideable for display to a user; calculating for the promotion a posterior distribution of a user-action probability reflecting estimates for a user response to a display of the promotion for the product on a computing device of the user; determining the posterior distribution as collapsing beyond a certain threshold; responsive to determining the posterior distribution as collapsing, calculating, using a set of formulas, an uncollapsed posterior distribution of the user-action probability reflecting modified estimates for the user response to the display of the promotion for the product on a computing device of the user, the set of formulas being adapted to prevent the uncollapsed posterior distribution from collapsing beyond the certain threshold; storing the uncollapsed posterior distribution of the user-action probability in a response database; and determining whether to select the promotion from the promotion database for display on a computing device of the user based on the modified estimates for the user response to the display of the promotion for the product on a computing device of the user.
(当審訳)
[0004]Webサイトの開発者は、多くの場合、どのバージョンの広告(ad)をWebページに掲載するかの決定に直面します。赤のバージョンAと青のバージョンBの2つのバージョンの広告があるとします。開発者は、最も多くのクリックを獲得する広告のバージョンを配置したいと考えていますが、どのバージョンであるかを事前に知りません。従来のアプローチは、A/Bテストを実行することです。ページが提供されるたびに、広告の赤色バージョンと青色バージョンのどちらを表示するかがランダムに選択され、いずれかのバージョンが表示される確率は50/50です。A/Bテストは一定期間進行し、その間に各バージョンのクリックスルーレート(CTR)が測定されます。A/Bテストが完了すると、測定されたCTRが最も高いバージョンの広告が表示されます。
[0005]しかし、疑問が残るかもしれません。A/Bテストは、広告のクリックスルーレートを確実に測定するのに十分なデータを取得するのに十分な期間実行されましたか?データが不十分な場合、クリックスルーレートのランダムな変動により、優れた広告よりも劣った広告が選択される可能性があり、将来のパフォーマンスに悪影響を与える決定になります。一方で、A/Bテストの実行期間が長すぎたのではないかという別の疑問が生じる可能性があります。A/Bテストでは上位の広告と下位の広告が表示されるため、下位の広告が表示されたページではクリックを逃す可能性があります。これが、強化学習アルゴリズムのパフォーマンス測定に付けられた「後悔」という名前の動機となっています。さらなる質問も提起される可能性があります。クリックスルーレートが時間の経過とともに変化する場合はどうなりますか?6月に実施したA/Bテストで青色の広告が1位になったとします。デザイナーがその年の残りの期間、青色の広告を掲載すると、12月に赤色の広告のクリック率が高くなる可能性があるため、機会費用が発生する可能性があります。これにより、さらに疑問が生じます。A/Bテストは定期的に実行する必要がありますか?はいの場合、どのくらいの頻度ですか?どのぐらいの間?既存の広告選択手順では、これらの質問に対する最適なソリューションを提供できません。
発明の概要
[0006]本開示で説明する主題の革新的な一態様によれば、本方法は、ユーザに表示するために、宣伝販売促進データベースから検索して提供する宣伝を決定することを含むことができ、プロモーションのためにユーザのコンピューティングデバイス上の製品の宣伝の表示に対するユーザの応答の推定値を反映するユーザアクション確率の事後分布を計算し、ある閾値を越えて崩壊しないように事後分布を決定するステップは、公式のセットを使用して、ユーザのコンピューティングデバイス上の製品の宣伝の表示に対するユーザの更新された推定値を反映するユーザアクション確率の崩壊していない事後分布を計算するように事後分布を決定することに応答して、式の特定のしきい値を越えてから崩壊していない事後分布を防止するように構成される1組のユーザアクション確率の崩壊していない事後分布を格納した応答のデータベースに、ユーザに表示するための更新された推定値に基づいてユーザのコンピューティングデバイス上に表示するためのプロモーションデータベースからプロモーションを選択するか否かを決定する。

Overview of Bayesian Bandits
[0026]The following description is given to aid in understanding the concept of promotion selection (e.g., advertisement selection, offer selection) using Bayesian Bandits, but this description is provided by way of example and should not be construed as limiting.
[0027]The tradeoff between measuring the click-through rate and displaying the current best advertisement is one example of the explore/exploit dilemma. Bayesian Bandit algorithms discussed herein provide an elegant and principled solution to the explore/exploit dilemma via the technique of Thompson Sampling. Rather than an arbitrary separation between an explore phase (A/B testing) and an exploit phase (displaying the best advertisement), the Bayesian Bandit algorithms (also simply referred to herein as Bayesian Bandits) model and update the click-through rates of the advertisements continuously. When asked to select an advertisement, the Bayesian Bandit algorithms draw samples from the click-through rate models and select the advertisement with a certain, such as the largest sampled value.
[0028]In general, the advertisement that provides the largest expected reward is generally selected, where the reward function may be chosen to maximize a chosen business objective, such as, but not limited to click-through rate (CTR), conversion rate, revenue, or margin.
[0029]The Bayesian Bandit can model each view or impression of an advertisement as a Bernoulli trial with probability parameter θ, which is the click-through rate (CTR) for the advertisement. As the click-through rates are generally not known in advance, the probability parameters are considered to be random variables in their own right, governed by probability distributions. Under a Bayesian approach, the probability distribution for a random variable reflects the state of knowledge about the variable. The prior distribution represents the state of knowledge before any data is seen. The posterior distribution reflects the state of knowledge of the variable after accumulating evidence. The posterior distribution is calculated using Bayes' Formula:

Here, X is the evidence (e.g., the data), P(θ|X) is the posterior distribution, P(X|θ) is the likelihood function, P(θ) is the prior distribution, and P(X) is the probability of the evidence.

(当審訳)
ベイズバンディットの概要
[0026]以下の説明は、ベイズバンディットを用いてプロモーションの選択(例えば、広告、オファー選択)の概念を理解するのを助けるために与えられているが、この説明は、例として提供され、限定として解釈されるべきではない。
[0027]クリックスルーレートを測定することと、現在の最良の広告を表示することの間のトレードオフは、探索/活用のジレンマの一例である。本明細書で論じるベイズバンディットアルゴリズムは、トンプソンサンプリングの技術を介して、探索/活用のジレンマに対する洗練された原理的な解決策を提供する。調査フェーズ(A/Bテスト)および活用フェーズ(最良の広告を表示する)の間の任意の分離ではなく、ベイズバンディットアルゴリズム(本明細書では単にベイズバンディットと呼ばれる)は、モデル化し、広告のクリックスルーレートを継続的に更新する。広告を選択するように求められた場合、ベイズバンディットアルゴリズムはクリックスルーレートモデルからサンプルを引き出して、価値が最大となるような特定の広告を選択する。
[0028]一般に、最大予想報酬を提供する広告が、一般に選択され、ここで、報酬関数は、選択したビジネス目的を最大とするように選択して、ビジネス目的は、これに限られないが、クリックスルーレート(CTR)、変換レート、収入、又はマージンであってもよい。
[0029]ベイズバンディットは、広告のクリックスルーレート(CTR)の確率パラメータθを用いたベルヌーイの試行として、広告の見た目や印象をモデル化することができる。クリックスルーレートは、一般に、前もって知られていないように、確率パラメータは、それ自体ランダム変数であり、確率分布によって支配されると考えられている。ベイズアプローチの下で、ランダム変数の確率分布は、変数に関する知識の状態を反映している。事前分布は、任意のデータが見られる前に、知識の状態を表している。事後分布は、証拠を蓄積した後に変数の知識の状態を反映する。事後分布は、ベイズの公式を用いて計算される。

ここで、Xは、証拠(例えば、データ)であり、 P(θ|X)は事後分布、 P(X|θ) は尤度関数、P(θ)は事前分布であり、P(X)は、証拠(Evidence)の確率である。

[0032]The conjugate prior of the Binomial distribution is the Beta distribution, which is a convenient choice for the prior P(θ), both because of its flexibility in modeling different prior assumptions about the parameter θ and because it leads to an analytically tractable update rule. The Beta distribution is given by:

(当審訳)
[0032]二項分布の前の共役は、ベータ分布である。それは、パラメータθについての異なる事前の仮定をモデリングする際のその柔軟性のために及び分析的に扱いやすい更新法則へ導くための両方のために、前のP(θ)のための便利な選択である。ベータ分布は、以下によって与えられる。

[0036]There is a complete cancellation of the normalizing factors in the numerator and denominator. Replacing the integral in EQU. 6 with the definition of the Beta function in EQU. 4, following equation is obtained:

[0037]Comparing EQU. 7 with EQU. 3, it may be apparent that the posterior distribution is also a Beta Distribution:

with shape parameters given by:

[0038]EQU. 9 expresses what is regarded as an update rule to go from the prior distribution to the posterior distribution: the first shape parameter α is incremented by the number of observed successes, and the second shape parameter β is incremented by the number of observed failures.
(当審訳)
[0036]分子及び分母の正規化因子の完全な除去である。式6の積分を式4のベータ関数の定義により置き換えると、次式が得られる。

[0037]式7を式3と比較すると、事後分布はベータ分布であることは明らかである。

形状パラメータは以下の式により与えられる。

[0038]式9は事前の分布から事後の分布に移行する更新規則と見なされるものを表現している。第1の形状パラメータαは観察された成功の数だけ増加する。そして第2の形状パラメータベータは観察された失敗の数だけ増加する。

[0043]FIG. 1 depicts plots 102 and 104 of example uninformative prior distributions, calculated by the distribution calculator 742 , for advertisements A and B, respectively at time t=0. Note that μ=1/2 for both the advertisements. The ads management module 740 may draw Samples PA and PB from the prior distributions PA(θA) and PB(θB), respectively, as calculated by the distribution calculator 742 , to determine which advertisement to present to a user. Here, θA and θB are the click-through rates of advertisements A and B respectively. Since, initially, both distributions are the same, in requests based on these there is a 50/50 chance that sample PA will exceed sample PB, and thus roughly equal numbers of two sets of advertisements are presented to users.
[0044]FIG. 2 depicts plots 202 and 204 of example posterior distributions calculated by the distribution calculator 742 for advertisements A and B, respectively after a total of n=nA+nB=50 page views have been served. As depicted, the ads management module 740 served advertisement A nA=20 times and served advertisement B has been served nB=30 times. Out of these servings, as depicted, clickstream data used by the distribution calculator 742 to generate the distributions indicated that kA=5 clicks are received from pages where advertisement A was served and kB=6 clicks from pages where advertisement B was served. In addition, using the clickstream data, the distribution calculator 742 determined an average click-through rate of μA=0.27 for advertisement A and an average click-through rate of μB=0.22 for advertisement B.
[0045]The example illustrated in FIG. 2 describes an embodiment where distribution calculator 742 performs Bayesian posterior updates in batch mode (e.g., after a certain number of pages have been served, a certain amount of time has elapsed, etc.). In other embodiments, the distribution calculator 742 may perform posterior updates continuously (e.g., after every page impression, etc.).
[0046]After a posterior update is completed by the distribution calculator 742 , the ads management module 740 may draw samples from the posterior distributions for each advertisement. For instance, the ads management module 740 may draw the sample PA from the posterior PA (θA|X), and the sample PB from the posterior PB (θB|X), where X represents the data used to perform the posterior updates. The ads management module 740 may then choose the advertisement with the largest posterior sample for display to a user. The ads management module 740 can repeat this process to select an advertisement for each page to serve until the next posterior update is performed by the distribution calculator 742 .
(当審訳)
[0043]図1は、時刻t=0に、広告A、Bは、それぞれ、分布算出部742により算出された、情報価値のない事前分布例のグラフ102および104を示す。なお、両方の広告についてμ=1/2である点に注意されたい。広告管理モジュール740は、分布算出部742において算出された事前分布PA(θA)及びPB(θB)からサンプルPA,PBを、それぞれユーザに提示するための広告を決定することができる。ここで、θA及びθBは、広告のクリック・スルー・レートである。最初に、両方の分布は同じであるので、これらに基づいて、ルーティングリクエストにおけるサンプルPA、PBを超過することになる確率は50/50にされ、こうして2組の広告についてほぼ等しい数がユーザに提示される。
[0044]図2は、合計n=nA+nB=50ページのビューが、提供された後の広告AおよびBに関する分布算出部742により算出された例示的な事後分布のプロット202及び204をそれぞれ表している。図示のように、広告管理モジュール740は、広告Aを、nA=20回供給し、広告Bを、nB=30回供給した。これらのうち、図に示すように、クリックストリームデータが分布算出部742によって分布を計算するために使用され、KA=5は、広告Aが提供されたページから5回クリックしたことを示し、kB=6は、広告Bが提供されたページから6回クリックされたことを示す。また、クリックストリームデータを用いて、分布算出部742は、広告Aに対して平均クリックスルーレートμA=0.27および広告Bに対して平均クリックスルーレートμB=0.22を決定した。
[0045]図2に示す例では、分布算出部742は、バッチモード(例えば、ページの特定の数が処理された後、経過時間等の特定の時間を要する)のベイズ事後更新を行う実施例について説明する。他の実施形態では、分布算出部742は、連続的に後更新を実行してもよい(例えば、各ページの印象の後、等)。
[0046]分布算出部742によって完成されている後側の更新後、広告管理モジュール740は、各広告に対する事後分布からサンプルを取り出すことができる。例えば、広告管理モジュール740は、PB(θB|X)からPA(θA|X)、PBからPAを描くことができ、Xは、後の更新を行うのに使用されるデータを表す。広告管理モジュール740は、次いで、ユーザに表示するために最大事後サンプルを用いて広告を選択することができる。広告管理部740は、分散計算部742が行う次の後側の更新までにサービスページ毎に広告を選択するためにこのプロセスを繰り返すことができる。

[0050]In some embodiments, the distribution collapse avoidance module 746 may execute the following update formulas to overcome the difficulties discussed above with respect to FIGS. 1-4 :

where tan h is the hyperbolic tangent function, α0, β0 are the shape parameters of the prior Beta distribution, n is the number of page views, and k is the number of successes, e.g. clicks or purchases (the latter are often called conversions).
(当審訳)
[0050]いくつかの実施形態では、分布の崩れ回避モジュール746は、以下の更新式を実行する図1-4に関して上述した困難性を克服することができる。

なお、tan hは双曲線正接関数、α0、β0は、ベータ分布の形状パラメータである場合、nは、ページビューの数であり、kは、成功回数(例えば、クリック又は購入(後者は、コンバージョン率と呼ばれることが多い))である。

[0058]Flow proceeds to block 620 where the distribution calculator 742 , the distribution collapse avoidance module 746 , and/or the ads diversity module 750 may decide whether a posterior update should be performed. This can be based on time elapsed since last update or number of impressions since last update. If it is not time for an update, flow resumes in blocks 608 and 610 where the ads management module 740 draws samples from the current posteriors, 604 and 606 , and the cycle is repeated as discussed above. If it is time for an update, the distribution calculator 742 , the distribution collapse avoidance module 746 , and/or the ads diversity module 750 may access data from the response database 618 to update 622 the posteriors according to the update rules given by EQU. 9, EQU. 13, or EQU. 14, as discussed elsewhere herein.
(当審訳)
[0058]フローはブロック620に進み、分布算出部742は、分布の崩壊回避モジュール746、及び/又は広告にダイバーシティモジュール750は後側の更新を実行すべきかどうかを決定することができる。これは、最後の更新から更新またはインプレッションの数から経過した時間に基づくことができる。更新する時間でない場合、フローは、ブロック608及び610において再開する広告管理モジュール740は、現在の事後分布、604及び606からサンプルを採取する場合、上述したようにサイクルが繰り返される。更新の時間であれば、分布算出部742は、分布の崩壊回避モジュール746、及び/又は広告にダイバーシティモジュール750は、応答データベース618からデータを取得し、本明細書で説明されている式9、式13、式14により与えられる更新規則に応じて事後分布を更新する622へ送信することができる。

以上の記載によると、引用文献1には、以下の事項が記載されている。
(ア)引用文献1の特許請求の範囲の請求項1には、「コンピュータにより実施される方法であって、/製品に関するプロモーションを決定することであって、プロモーションはプロモーションデータベースから検索すること及びユーザのディスプレイに提供することが可能であって」(/は改行を示す。以下、同じ。)と記載されているから、引用文献1には「コンピュータが製品に関するプロモーションを決定する方法」の発明が記載されているといえる。
(イ)同請求項1の記載から、上記(ア)の発明は「ユーザのコンピュータデバイスに、商品のためのプロモーションの表示を行うことに関して、プロモーションのために、ユーザ応答のための推定値を反映したユーザアクションの可能性の事後分布を計算」している。
上記プロモーションの表示は、[0043]の記載によれば、広告A、広告Bを表示することであるといえる。
(ウ)同請求項1の「事後分布は、ユーザのコンピュータデバイスへの商品のプロモーションのための表示に対するユーザの応答による、更新した推定値を反映したユーザアクションの可能性の崩壊していない事後分布」の記載によれば、「事後分布は、ユーザのコンピュータデバイスへの商品のプロモーションのための表示に対するユーザの応答による、更新した推定値を反映したユーザアクションの可能性に関する事後分布」といえる。
そして、引用文献1の[0027]の「ベイズバンディットアルゴリズム(本明細書では単にベイズバンディットと呼ばれる)は、モデル化し、広告のクリックスルーレートを継続的に更新する。」の記載によれば、上記(ア)の発明は、クリックスルーレートを得て継続的に更新しているといえるから、請求項1の「ユーザ応答」、「ユーザアクション」は、ユーザが表示された広告に対してクリックすることを示しているといえる。
(オ)引用文献1の[0046]の「分布算出部742によって完成されている後側の更新後、広告管理モジュール740は、各広告に対する事後分布からサンプルを取り出すことができる。例えば、広告管理モジュール740は、PB(θB|X)からPA(θA|X)、PBからPAを描くことができ、Xは、後の更新を行うのに使用されるデータを表す。広告管理モジュール740は、次いで、ユーザに表示するために最大事後サンプルを用いて広告を選択することができる。広告管理部740は、分散計算部742が行う次の後側の更新までにサービスページ毎に広告を選択するためにこのプロセスを繰り返すことができる。」の記載によれば、上記(ア)の発明は、事後分布から最大値となる最大事後サンプルを用いて広告を選択しているといえる。
(カ)[0037]の記載によれば「事後分布はベータ分布」である。
(キ)[0037]、[0038]の記載によれば、事後分布の形状を表すパラメータα、βは、式9に表される更新規則により更新されるものであって、第1の形状パラメータαは観察された成功の数だけ増加し、第2の形状パラメータβは観察された失敗の数だけ増加するものであるといえる。
そして、式9をみると、更新後のαは、更新前のα0にkを加えたものであり、更新後のβは更新前のβ0に(n−k)を加えたものである。
また、[0050]の記載によれば、α0、β0はベータ分布の形状パラメータであるとき、nは、ページビューの数であり、kは、成功回数(例えば、クリック又は購入(後者は、コンバージョン率と呼ばれることが多い))であるから、α0、β0はページビューとクリックの実績に基づいた値であるといえる。
(ク)[0058]の記載によれば、更新するか否かは、最後の更新から経過した時間に基づき決定されるものであることが記載されている。
(ケ)[0026]に「ベイズバンディットを用いてプロモーションの選択(例えば、広告、オファー選択)の概念を理解するのを助けるために与えられている」とあるから、引用文献1の「プロモーション」は広告を含むものであって、「広告」と置き換えることができる。
(コ)以上まとめると、引用文献1には、以下の発明(以下、引用発明という。)が記載されている。

コンピュータが製品に関するプロモーション(広告)を決定する方法であって、
ユーザのコンピュータデバイスに、商品のためのプロモーション(広告A、広告B)の表示を行うことに関して、プロモーション(広告)のために、ユーザ応答(広告に対するクリック)のための推定値を反映したユーザアクション(ユーザが広告をクリックすること)の可能性の事後分布(ベータ分布)を計算し、
事後分布(ベータ分布)は、ユーザのコンピュータデバイスへの商品のプロモーションのための表示(広告A、広告Bの表示)に対するユーザの応答(広告に対するクリック)による、更新した推定値を反映したユーザアクション(ユーザが広告をクリックすること)の可能性に関する事後分布(ベータ分布)であり、
事後分布(ベータ分布)から最大値となる最大事後サンプルを用いて広告を選択し、
事後分布(ベータ分布)の形状を表すパラメータα、βは、更新規則により更新されるものであって、
更新後のαは、更新前のα0にkを加えたものであり、更新後のβは更新前のβ0に(n−k)を加えたものであり、
α0、β0はページビューとクリックの実績に基づいた値であり、
更新するか否かは、最後の更新から経過した時間に基づき決定される、
広告を選択・決定する方法。

(III)対比・判断
(ア)引用発明はコンピュータが広告を選択・決定する方法であるから、補正後発明と「コンピュータが広告を決定する方法」である点で共通する。
もっとも、「広告を決定する方法」に関して、補正後発明は、「広告形態決定方法」であるのに対し、引用発明は「広告形態決定方法」であるか明らかでない点で相違する。

(イ)引用発明は、「ユーザのコンピュータデバイスに、商品のためのプロモーション(広告A、広告B)の表示を行うことに関して、プロモーション(広告)のために、ユーザ応答(広告に対するクリック)のための推定値を反映したユーザアクション(ユーザが広告をクリックすること)の可能性の事後分布(ベータ分布)を計算し」ているから、広告A、広告Bを表示することでなされた、ユーザが広告をクリックした回数を得ているといえる。ここで、わざわざ、広告A、広告Bとしているのは、広告A、広告Bが何らかの点で異なってることを示すことは明らかであるから、引用発明は「異なる複数の広告を配信した際のクリック実績を取得し」ている点で、補正後発明と共通する。
もっとも、異なる複数の広告が、補正後発明は、「広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告」であるのに対し、引用発明は、「広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告」であるかは明らかでない点で相違する。

(ウ)引用発明は「ユーザアクション(ユーザが広告をクリックすること)の可能性の事後分布(ベータ分布)を計算し」ているから、「クリックされやすさを表すベータ分布をそれぞれ生成し」ている。
そして、引用発明において、上記クリックされやすさを表すベータ分布は、広告A、広告Bを表示したときのクリックされた回数に基づいているから、「取得されたクリック実績に基づいて、前記異なる広告ごとのクリックされやすさを表すベータ分布」であるといえる点で、補正後発明と共通する。
もっとも、「異なる広告ごとのクリックされやすさ」が、補正後発明では、「前記広告デザインごとのクリックされやすさ」であるのに対し、引用発明では、上記(イ)と同様「前記広告デザインごとのクリックされやすさ」であるか明らかでない点で相違する。

(エ)引用発明では「事後分布(ベータ分布)の形状を表すパラメータα、βは、更新規則により更新される」から、前記ベータ分布のパラメータαおよびβを更新させている。
上記更新は、「更新後のαは、更新前のα0にkを加えたものであり、更新後のβは更新前のβ0に(n−k)を加えたものであ」って、「α0、β0はページビューとクリックの実績に基づいた値である」から、更新前のパラメータα0、β0に、直近のクリック実績に基づく成分を反映させて更新しているといえる。
また、「更新するか否かは、最後の更新から経過した時間に基づき決定される」のであるから、上記更新は、所定の時間の経過に基づき行われるということができ「直近の所定時間内のクリック実績に基づく成分を反映させて更新」しているといえる。
以上のことから、引用発明は「前記ベータ分布のパラメータαおよびβを、更新前のパラメータαおよびβに、直近の所定時間内のクリック実績に基づく成分を反映させて更新する」構成である点で、補正後発明と相違がない。

(オ)まとめ(一致点・相違点)
以上の対比によると、補正後発明と引用発明とは、以下の一致点で一致し相違点で相違する。

(一致点)
コンピュータが
異なる複数の広告を配信した際のクリック実績を取得し、
取得されたクリック実績に基づいて、前記異なる広告ごとのクリックされやすさを表すベータ分布を生成し、
前記ベータ分布のパラメータαおよびβを、更新前のパラメータαおよびβに、直近の所定時間内のクリック実績に基づく成分を反映させて更新する、
広告を決定する方法。

(相違点)
相違点1
「広告を決定する方法」に関して、補正後発明は、「広告形態決定方法」であるのに対し、引用発明は「広告形態決定方法」であるか明らかでない点
相違点2
「異なる複数の広告」が、補正後発明は、「広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告」であるのに対し、引用発明は、「広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告」であるかは明らかでない点
相違点3
「異なる広告ごとのクリックされやすさ」が、補正後発明では、「前記広告デザインごとのクリックされやすさ」であるのに対し、引用発明では、相違点2と同様「前記広告デザインごとのクリックされやすさ」であるか明らかでない点

(カ)判断
(相違点2について)
事案に鑑み、まず相違点2について検討する。
引用発明の異なる広告について、引用文献1には、次のとおりの記載がある。
「Webサイトの開発者は、多くの場合、どのバージョンの広告(ad)をWebページに掲載するかの決定に直面します。赤のバージョンAと青のバージョンBの2つのバージョンの広告があるとします。開発者は、最も多くのクリックを獲得する広告のバージョンを配置したいと考えていますが、どのバージョンであるかを事前に知りません。」([0004])
「本方法は、ユーザに表示するために、宣伝販売促進データベースから検索して提供する宣伝を決定することを含むことができ、プロモーションのためにユーザのコンピューティングデバイス上の製品の宣伝の表示に対するユーザの応答の推定値を反映するユーザアクション確率の事後分布を計算し、ある閾値を越えて崩壊しないように事後分布を決定するステップは、公式のセットを使用して、ユーザのコンピューティングデバイス上の製品の宣伝の表示に対するユーザの更新された推定値を反映するユーザアクション確率の崩壊していない事後分布を計算するように事後分布を決定することに応答して」([0006])
上記[0004]の記載によれば、広告は「赤のバージョンAと青のバージョンBの2つのバージョンの広告」であってもよいといえ、少なくとも赤色・青色という色が与えられた、色が異なる広告であり、色が異なるということは広告デザインが異なるといえるから、「配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告」も想定されている。
そして、上記広告は、[0008]の記載によれば、「コンピューティングデバイス上の製品の宣伝の表示」であることが想定されているから、「広告対象に対」する表示であるといえ、「広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告」といえることは明らかである。
また、上記[0004]には、「開発者は、最も多くのクリックを獲得する広告のバージョンを配置したいと考えていますが、どのバージョンであるかを事前に知りません」との記載があるが、「最も多くのクリックを獲得する広告のバージョン」について、例えば、デザイン以外の要素(広告対象も含む)が異なれば、クリックの獲得において、デザインの相違によってクリックの獲得数に差が出たのか、それ以外の要素の相違によってクリックの獲得数に差が出たのかその要因が不明となることは明らかである。
すなわち、引用文献1において、わざわざ、赤のバージョンAと青のバージョンBの2つのバージョンの広告を表示し、そのクリックの獲得数の多い広告を選択しようとするのは、同じ広告対象に対して、赤のバージョンAと青のバージョンBというデザインのバージョン(だけが)が異なる2つの広告を表示して、そのクリックの獲得数が多い広告を選択することで、よりクリックの獲得数の多いデザインのバージョンの広告を選択しようとする技術であることは、当業者であれば、普通に理解できることである。
また、広告は、広告依頼主から入稿されるものであることも普通のことである。
以上の引用文献1の上記前提となる技術を総合すれば、引用文献1に記載された技術は、「広告依頼主から入稿された内容である広告対象が共通し、且つ、前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザインが異なる複数の広告」について、よりクリックの獲得数が多い広告を選択することを想定していることは当業者であれば普通に理解できるものである。
したがって、引用発明の異なる広告について、相違点2の構成を想定することは、当業者が容易になし得たことである。
(相違点1について)
上記相違点2についてで検討したように、「引用文献1において、わざわざ、赤のバージョンAと青のバージョンBの2つのバージョンの広告を表示し、そのクリックの獲得数の多い広告を選択しようとするのは、同じ広告対象に対して、赤のバージョンAと青のバージョンBというデザインのバージョン(だけが)が異なる2つの広告を表示して、そのクリックの獲得数が多い広告を選択することで、よりクリックの獲得数の多いデザインのバージョンの広告を選択しようとする技術であることは、当業者であれば、普通に理解できる」のであるから、引用発明の「広告を決定する方法」は、広告の同じ広告対象に対して、赤のバージョンAと青のバージョンBという形態の異なる広告から、何れかの広告を選択する方法であるといえ、引用発明の「広告を決定する方法」を「広告形態決定方法」とすることは、当業者が容易になし得たことである。
(相違点3について)
上記相違点2についてで検討したように、「引用文献1において、わざわざ、赤のバージョンAと青のバージョンBの2つのバージョンの広告を表示し、そのクリックの獲得数の多い広告を選択しようとするのは、同じ広告対象に対して、赤のバージョンAと青のバージョンBというデザインのバージョン(だけが)が異なる2つの広告を表示して、そのクリックの獲得数が多い広告を選択することで、よりクリックの獲得数の多いデザインのバージョンの広告を選択しようとする技術であることは、当業者であれば、普通に理解できる」のであるから、引用発明の「異なる広告ごとのクリックされやすさ」を「前記広告デザインごとのクリックされやすさ」とすることは、当業者が容易になし得たことである。

(キ)効果
以上のように、上記相違点は、当業者が容易に想到し得たものと認められ、本願発明全体としてみても格別のものはなく、その作用効果も、上記相違点に係る構成の採用に伴って当然に予測される程度のものにすぎない。

(ク)まとめ(独立特許要件)
以上によれば、補正後発明は、引用文献1に記載された発明に基づいて当業者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により、特許出願の際独立して特許を受けることができない。

3.本件補正についてのむすび
したがって、本件補正は、特許法第17条の2第6項において準用する同法第126条第7項の規定に違反するので、同法第159条第1項の規定において読み替えて準用する同法第53条第1項の規定により却下すべきものである。

よって、上記補正の却下の決定の結論のとおり決定する。

第3 本願発明について
1.本願発明
(ア)補正前の請求項5に記載された発明
令和3年6月15日にされた手続補正は上記のとおり却下されたので、本願の請求項1ないし請求項6に係る発明は、令和3年2月26日にされた手続補正により補正された特許請求の範囲の請求項1ないし請求項6に係る発明のとおりであるところ、そのうち、補正前の請求項5に記載された発明(以下、本願発明という。)は、以下のとおりのものである。((a)〜(e)は当審が付与した。以下「構成要件(a)」等として引用する。)

【請求項5】
(a)コンピュータが
(b)広告対象が共通し且つ広告デザインの異なる複数の広告を配信した際のクリック実績を取得し、
(c)取得されたクリック実績に基づいて、前記広告デザインごとのクリックされやすさを表すベータ分布をそれぞれ生成し、
(d)前記ベータ分布のパラメータαおよびβを、更新前のパラメータαおよびβに、直近の所定時間内のクリック実績に基づく成分を反映させて更新する、
(e)広告形態決定方法。

2.引用文献・引用発明
原査定の拒絶の理由で引用された引用文献1の記載事項及び当該記載事項から認定できる引用発明は、前記第2の《理由》2.(2−3)(II)に記載したとおりである。

3.対比・判断
本願発明は、前記第2の《理由》で検討した補正後発明から、「広告依頼主から入稿された内容である広告対象」、「前記広告対象に対して、配置、色、および大きさのうち少なくとも一部を含む要素が与えられた広告デザイン」に係る限定事項(上記下線部)を削除したものである。
そうすると、本願発明の発明特定事項を全て含み、さらに他の事項を付加したものに相当する補正後発明が、前記第2の《理由》2.(2−3)(III)に記載したとおり、引用発明に基づいて、当業者が容易に発明をすることができたものであるから、本願発明も、引用発明に基づいて、当業者が容易に発明をすることができたものである。

第4 むすび
以上のとおり、本願発明は、特許法29条2項の規定により特許を受けることができないから、他の請求項に係る発明について検討するまでもなく、本願は拒絶されるべきものである。

よって、結論のとおり審決する。
 
別掲 (行政事件訴訟法第46条に基づく教示) この審決に対する訴えは、この審決の謄本の送達があった日から30日(附加期間がある場合は、その日数を附加します。)以内に、特許庁長官を被告として、提起することができます。
 
審理終結日 2022-09-27 
結審通知日 2022-10-04 
審決日 2022-10-18 
出願番号 P2017-079544
審決分類 P 1 8・ 121- Z (G06Q)
P 1 8・ 575- Z (G06Q)
最終処分 02   不成立
特許庁審判長 高瀬 勤
特許庁審判官 相崎 裕恒
渡邊 聡
発明の名称 広告形態決定装置、広告形態決定方法、及びプログラム  
代理人 松沼 泰史  
代理人 渡辺 伸一  
代理人 酒井 太一  
代理人 沖田 壮男  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ