• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 1項3号刊行物記載 取り消して特許、登録 G06F
審判 査定不服 特36条6項1、2号及び3号 請求の範囲の記載不備 取り消して特許、登録 G06F
審判 査定不服 2項進歩性 取り消して特許、登録 G06F
管理番号 1408906
総通号数 28 
発行国 JP 
公報種別 特許審決公報 
発行日 2024-04-26 
種別 拒絶査定不服の審決 
審判請求日 2023-06-01 
確定日 2024-04-11 
事件の表示 特願2021−544350「ジェスチャ制御方法及び装置」拒絶査定不服審判事件〔令和 3年 4月29日国際公開、WO2021/077840、令和 4年 3月28日国内公表、特表2022−520030、請求項の数(11)〕について、次のとおり審決する。 
結論 原査定を取り消す。 本願の発明は、特許すべきものとする。 
理由 第1 手続の経緯
本願は、2020年(令和2年)7月29日(パリ条約による優先権主張2019年10月22日、中国)を国際出願日とする出願であって、その手続の経緯は以下のとおりである。
令和3年 7月29日: 手続補正書の提出
令和4年 8月 4日付け:拒絶理由通知書
令和5年 1月 6日: 意見書、手続補正書の提出
令和5年 2月 8日付け:拒絶査定
令和5年 6月 1日: 審判請求書、手続補正書の提出
令和5年11月27日付け:拒絶理由通知書
令和6年 2月26日: 意見書、手続補正書の提出

第2 原査定の概要
原査定(令和5年2月8日付け拒絶査定)の概要は次のとおりである。

1.(新規性)この出願の請求項1、4、7−12に係る発明は、下記の引用文献1に記載された発明であるから、特許法第29条第1項第3号に該当し、特許を受けることができない。

2.(進歩性)この出願の請求項1、4、7−12に係る発明は、下記の引用文献1に記載された発明に基いて、請求項2−3に係る発明は、下記の引用文献1、2に記載された発明に基いて、請求項5−6に係る発明は、下記の引用文献1−3に記載された発明に基いて、その出願前にその発明の属する技術の分野における通常の知識を有する者(以下、「当業者」という。)が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができない。

<引用文献等一覧>
1.特開2018−036902号公報
2.国際公開第2014/030442号
3.特開2017−173927号公報

第3 当審拒絶理由の概要
当審が令和5年11月27日付けで通知した拒絶理由(以下「当審拒絶理由」という。)の概要は次のとおりである。

明確性)この出願は、特許請求の範囲の記載が下記の点で、特許法36条6項2号に規定する要件を満たしていない。

・請求項 1−11

請求項1の「前記ジェスチャ認識結果シーケンスに含まれる複数の同一ジェスチャ認識結果には相違ジェスチャ認識結果が含まれること、かつ、前記ジェスチャ認識結果シーケンスにおける前記相違ジェスチャ認識結果の数の割合がプリセットされた値未満であることに応答して、前記相違ジェスチャ認識結果に対して平滑化処理を実行することであって、前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なる、ことと」の記載における、「複数の同一ジェスチャ認識結果には相違ジェスチャ認識結果が含まれる」の記載と「前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なる」の記載は矛盾した関係となっているので、「ジェスチャ認識結果シーケンス」における「同一ジェスチャ認識結果」及び「相違ジェスチャ認識結果」の関係が不明確である。
請求項1を引用する請求項2−8、10、11、請求項1と同様の記載を有する請求項9についても同様の理由が該当する。

よって、請求項1−11に係る発明は明確でない。

第4 本願発明
本願請求項1−11に係る発明(以下、それぞれ「本願発明1」−「本願発明11」という。)は、令和6年2月26日提出の手続補正書により補正された特許請求の範囲の請求項1−11に記載された事項により特定される発明であり、本願発明1、9は以下のとおりの発明である。

「 【請求項1】
ジェスチャ制御方法であって、
カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行して、ジェスチャ認識結果シーケンスを取得することであって、前記ジェスチャ認識結果シーケンスは、前記Nフレームの画像に含まれる複数のジェスチャの認識結果を含む、ことと、
前記ジェスチャ認識結果シーケンスに含まれる複数の同一ジェスチャ認識結果間に相違ジェスチャ認識結果が含まれること、かつ、前記ジェスチャ認識結果シーケンスにおける前記相違ジェスチャ認識結果の数の割合がプリセットされた値未満であることに応答して、前記相違ジェスチャ認識結果に対して平滑化処理を実行することであって、前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なる、ことと、
前記平滑化処理後の前記ジェスチャ認識結果シーケンスに含まれる同一ジェスチャ認識結果の数がMより大きいか等しいことに応答して、前記同一ジェスチャ認識結果が目標ジェスチャ認識結果であると決定することであって、NおよびMは、両方とも1より大きい整数であり、Nは、Mより大きいか等しい、ことと、
前記目標ジェスチャ認識結果に対応する制御命令を目標機器に送信するか、または、前記目標ジェスチャ認識結果に対応する操作を実行するように目標機器を制御することと
を含み、
前記カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行することは、
前記ビデオストリーム内の単一フレームのカメラによって収集された画像を取得することであって、前記カメラによって収集された画像は、カメラ撮影視野空間に対応する画像であり、前記カメラ撮影視野空間は、ジェスチャ制御の有効空間領域を含む、ことと、
前記カメラによって収集された画像から、前記ジェスチャ制御の有効空間領域に対応する部分画像領域を選択することと、
前記部分画像領域に対して前記ジェスチャ認識処理を実行することと
を含む、ジェスチャ制御方法。」

「 【請求項9】
ジェスチャ制御装置であって、前記ジェスチャ制御装置は、認識処理モジュールとジェスチャ決定モジュールと操作制御モジュールとを備え、
前記認識処理モジュールは、カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行して、ジェスチャ認識結果シーケンスを取得するように構成されており、前記ジェスチャ認識結果シーケンスは、前記Nフレームの画像に含まれる複数のジェスチャの認識結果を含み、
前記ジェスチャ決定モジュールは、前記ジェスチャ認識結果シーケンスに含まれる複数の同一ジェスチャ認識結果間に相違ジェスチャ認識結果が含まれること、かつ、前記ジェスチャ認識結果シーケンスにおける前記相違ジェスチャ認識結果の数の割合がプリセットされた値未満であることに応答して、前記相違ジェスチャ認識結果に対して平滑化処理を実行するように構成されており、前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なり、
前記ジェスチャ決定モジュールは、前記平滑化処理後の前記ジェスチャ認識結果シーケンスに含まれる同一ジェスチャ認識結果の数がMより大きいか等しいことに応答して、前記同一ジェスチャ認識結果が目標ジェスチャ認識結果であると決定するようにさらに構成されており、NおよびMは、両方とも1より大きい整数であり、Nは、Mより大きいか等しく、
前記操作制御モジュールは、前記目標ジェスチャ認識結果に対応する制御命令を目標機器に送信するか、または、前記目標ジェスチャ認識結果に対応する操作を実行するように目標機器を制御するように構成されており、
前記認識処理モジュールは、前記カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行する場合において、
前記ビデオストリーム内の単一フレームのカメラによって収集された画像を取得することであって、前記カメラによって収集された画像は、カメラ撮影視野空間に対応する画像であり、前記カメラ撮影視野空間は、ジェスチャ制御の有効空間領域を含む、ことと、
前記カメラによって収集された画像から、前記ジェスチャ制御の有効空間領域に対応する部分画像領域を選択することと、
前記部分画像領域に対して前記ジェスチャ認識処理を実行することと
を行うようにさらに構成されている、ジェスチャ制御装置。」

また、本願発明2−8、10、11は、本願発明1を減縮した発明である。

第5 引用文献、引用発明等
1 引用文献1及び引用発明
(1) 引用文献1
原査定の拒絶の理由に引用された引用文献1には、以下の記載がある(下線は、特に着目した箇所を示す。以下同様。)。

ア 「【図1】



イ 「【0011】
以下、本発明の実施の形態について、詳細に説明する。実施形態に記載の機器操作システムは、サイネージ、PC、スマートフォン、HMD、家電機器、自動車装備などの各種機器をジェスチャ入力および音声入力により操作する機器操作システムとして構成される。
【0012】
(システム構成)
図1は、実施形態に記載の機器操作システムの構成例を示すブロック図である。図1に示すように、機器操作システム1は、中央処理装置(CPU:Central Processing Unit)11と、読み取り専用メモリ(ROM:Read Only Memory)12と、ランダムアクセスメモリ(RAM:Random Access Memory)13と、音声入力部14と、撮像部15と、出力部16、機器機能処理部17と、これらを接続する接続手段10とを備えて構成される。」

ウ 「【図3】



エ 「【0026】
ジェスチャ入力判定処理について説明する。図3に示すジェスチャ入力判定処理では、特定ジェスチャがなされたことを判定して、特定ジェスチャ判定フラグをOFFからONに変化させる。まず、図3に示すように、撮像部15により操作者の1フレームの画像を取得し(S31)、取得した1フレームの画像についてジェスチャ入力の検出を行なうジェスチャ入力検出処理を行なう(S32)。
【0027】
ジェスチャ入力検出処理(S32)は、取得した画像中のジェスチャの有無を判定すると共に、ジェスチャが有りと判定した場合は、さらにどのようなジェスチャであるのかを判定する。「どのようなジェスチャであるのか」とは、ジェスチャの内容のことであり、例えば、グー、パーなどの手のひらの形状であったり、手のひらが右向き、手のひらが左向きなどの手のひらの向きであったり、腕を曲げた、腕を伸ばしたなどの腕の状態であったり、その他、手、足、頭などいずれかの身体に関連する状態や、必要に応じてそれらの位置を判定結果とするものである。
【0028】
次いで、特定ジェスチャ判定フラグ設定処理を行なう(S33)。特定ジェスチャ判定フラグ設定処理では、現在のフレームでのS32におけるジェスチャ入力の検出結果と過去のジェスチャ入力の検出結果の履歴データとに基づいて、特定のジェスチャが行なわれているかどうかの特定ジェスチャ判定処理を行ない、この判定結果に基づいて判定フラグのON/OFF(それぞれ有効/無効ともいう)を行なう。
【0029】
特定ジェスチャ判定処理は、過去から現在のフレームまでの所定数(現在のフレームのみでも可)のジェスチャ入力の検出結果のそれぞれのジェスチャ入力について、予め記憶されている特定ジェスチャとの一致を判定する。このとき、ROM12等に設けられたデータベース等に予め特定ジェスチャが格納されているので、ジェスチャ入力と格納された特定ジェスチャとの一致(部分一致を含む)を判断し、一致した場合に特定ジェスチャを検出したと判定する。操作意思判定フェーズF1では、予め決められた操作意思を示す、1つまたは複数の特定ジェスチャとの一致を判定することができる。
【0030】
過去から現在のフレームまでの所定数のジェスチャ入力の検出結果の中に、特定ジェスチャと一致するものが、閾値以上である場合にその特定ジェスチャの判定フラグをONに変更またはONを維持し、閾値未満である場合にその特定ジェスチャの判定フラグをOFFに変更またはOFFを維持する。例えば、フラグ変更の閾値が3であるとき、現フレームを含む連続する5フレームのうち、3フレームだけ特定ジェスチャが検出されたと判定された場合に、その特定ジェスチャの判定フラグをONに変更し、3フレーム特定ジェスチャが検出されなかった場合は、その特定ジェスチャの判定フラグをOFFに変更したりすることができる。閾値を設けて所定数のフレームに亘るジェスチャに基づいて判定すると、一時的な身体のブレなどによる誤検出を防止することができる。閾値はONにする場合とOFFにする場合で異なっていてもよい。
【0031】
特定ジェスチャ判定フラグ設定処理(S33)を実行した後、ジェスチャの検出結果の履歴保存処理(S34)を行なう。ジェスチャの検出結果の履歴保存処理では、ジェスチャ入力検出処理S32で検出したジェスチャの内容を記録し、履歴として保存する。履歴は、例えばRAM13等に設けられたデータベース等に逐次記憶していけばよい。別の態様として、履歴は、操作意思判定フェーズF1では、操作意思を示す特定ジェスチャの有無を記録し、操作指示フェーズF2では、ジェスチャ入力検出処理S32における検出結果としてのジェスチャの内容を記録することとしてもよい。
【0032】
このジェスチャの検出結果の履歴保存処理(S34)は、ジェスチャ入力検出処理S32の後であればよく、特定ジェスチャ判定フラグ設定処理S33の前に行なうこととしてもよい。なお、特定ジェスチャ判定フラグ設定処理を上記のように複数フレームのジェスチャ検出結果によらず、現在のフレームに対してのみ行なう場合は、この履歴保存処理S34を省略することができる。
【0033】
ジェスチャの検出結果の履歴保存処理(S34)が終了すると、再び画像取得処理(S31)に戻り、次のフレームについてのジェスチャ入力判定処理を行なう。」

オ 「【0052】
操作指示フェーズF2では、これらの処理の結果に基づいて、操作指示が有ったか否かを判定する(S3)。操作指示の有無は、それぞれの入力判定処理(図3、図4)において変更され得る特定ジェスチャ判定フラグや特定音声判定フラグに基づいて判定する。操作指示フェーズF2では、特定ジェスチャ入力判定フラグと特定音声判定フラグの少なくとも一方のフラグがONであることをもって操作指示が有ったと判定できる。もちろん、操作の内容によっては、両方のフラグが有効であることを操作指示の条件としてもよい。
【0053】
操作指示が有ったと判定できた場合(S3:Yes)は、図3、図4の判定処理、にて入力があったと判定された、予め決められた入力パターン(動作のみ、音声のみ、動作および音声)に合致している操作指示を操作対象に対して行なうことにより、操作対象のシステムを制御する(S4)。操作対象のシステムの制御(S4)は、機器機能処理部17により操作対象の機器の機能を動作処理することであって、例えば照明の場合、照明を点灯、調光することや、TVの場合、TVのオンオフや選局したり、音量調節したりすることなどである。」

ここで、上記ア−オの記載から、引用文献1には、「機器操作システムにおける方法」が記載されていると認められる。

(2) 引用発明
したがって、引用文献1には、次の発明(以下「引用発明」という。)が記載されていると認められる。

「機器操作システムであって、
機器操作システムは、撮像部を備えて構成され、
ジェスチャ入力判定処理について、撮像部により操作者の1フレームの画像を取得し、取得した1フレームの画像についてジェスチャ入力の検出を行なうジェスチャ入力検出処理を行ない、
ジェスチャ入力検出処理は、取得した画像中のジェスチャの有無を判定すると共に、ジェスチャが有りと判定した場合は、さらにどのようなジェスチャであるのかを判定し、「どのようなジェスチャであるのか」とは、ジェスチャの内容のことであり、
次いで、特定ジェスチャ判定フラグ設定処理を行ない、
過去から現在のフレームまでの所定数のジェスチャ入力の検出結果のそれぞれのジェスチャ入力について、予め記憶されている特定ジェスチャとの一致を判定し、
過去から現在のフレームまでの所定数のジェスチャ入力の検出結果の中に、特定ジェスチャと一致するものが、閾値以上である場合にその特定ジェスチャの判定フラグをONに変更し、フラグ変更の閾値が3であるとき、現フレームを含む連続する5フレームのうち、3フレームだけ特定ジェスチャが検出されたと判定された場合に、その特定ジェスチャの判定フラグをONに変更し、
特定ジェスチャ判定フラグ設定処理を実行した後、ジェスチャの検出結果の履歴保存処理を行ない、ジェスチャ入力検出処理で検出したジェスチャの内容を記録し、履歴として保存し、
ジェスチャの検出結果の履歴保存処理が終了すると、再び画像取得処理に戻り、次のフレームについてのジェスチャ入力判定処理を行ない、
特定ジェスチャ入力判定フラグがONであることをもって操作指示が有ったと判定し、
操作指示が有ったと判定できた場合、操作対象のシステムを制御する、
機器操作システムにおける方法。」

2 引用文献2、3について
(1) 引用文献2には、以下の記載がある。

「[図2]



「[0038] 次に、図2を用いて、本実施形態の処理の流れの一例について説明する。なお、当該例における認識対象は人(操作者)の手である。図2は、本実施形態の入力方法を用いて操作者のジェスチャに基づき所定の情報を入力するためのステップを示すフローチャートである。当該入力に従い、例えばコンピュータやマシンが動作することとなる。すなわち、操作者のジェスチャにより、例えばコンピュータやマシンが操作される。」

「[図4]



「[0056] ここで、図4を用い、具体例を挙げて本実施形態の処理を説明する。図4の(a)は本実施形態の後処理がない場合(比較例)であり、(b)は本実施形態の後処理がある場合(実施例)である。
[0057] 横軸に時間軸をとっている。認識対象は手であり、最初グーの形状とし、その後形状をパーに変化させた。解析結果の欄に、解析結果を示している。Aは、解析結果が「グー」であり、Bは、解析結果が「パー」を示す。縦一列分が1フレーム分に対応している。実施例及び比較例いずれも、手の形状がグーの時は正しい解析結果が得られているが、手の形状がパーの時に2フレーム分誤った解析結果が得られている。すなわち、手の形状がパーであるのに、解析結果が「A」となっている箇所がある。このような誤認識は、手の角度がわずかに変わったとき、センサの不具合などで正確な判定が出来ないとき、手を動かしながら操作をしたとき、などに起こりえる誤認識である。
[0058] 後処理を含まない比較例の場合、解析結果がそのまま、入力内容を決定するための値(認識結果出力)となる。図示するように、比較例の場合、解析結果の欄の値と、認識結果出力欄の値が、いずれの撮像フレームにおいても一致している。
[0059] かかる場合、手の形状がパーの時に発生した2フレーム分の誤った解析結果をそのまま反映して、入力内容を受付けてしまう。結果、本来ならば、グーに対応する入力を受付け、その後、パーに対応する入力を受付ける所、比較例の場合、グーに対応する入力結果を受付けた後、パーに対応する入力を受付け、その後、グーに対応する入力を受付け、さらに、パーに対応する入力を受付けるというように、余計な入力を受付けてしまう。
[0060] これに対し、後処理を含む実施例の場合、解析結果がそのまま入力内容を決定するための値とはならず、後処理を受けた後の値が、入力内容を決定するための値(後処理後の出力:有効解析結果記憶部40に記憶される値)となる。
[0061] なお、当該例においては、過去2フレーム分の解析結果を利用して、最新のフレームの解析結果の有効性を判断する。具体的には、過去2フレーム分の解析結果、及び、最新の撮像フレームの解析結果のすべてが一致する場合、その最新の撮像フレームの解析結果を有効とする。一方、過去2フレーム分の解析結果、及び、最新の撮像フレームの解析結果が完全に一致しない場合、その最新の撮像フレームの解析結果を無効とする。
[0062] 図示するように、手の形状がグーの時、最初の撮像フレームから解析結果Aが得られているが、最初から2つ目の撮像フレームまでの解析結果は、過去2フレーム分の解析結果と一致しないため(初期値である(2)解析結果なし(図中の「−」)を含むため)、これらの撮像フレームに対する解析結果は無効と判断される(有効性の欄の値がバツ)。このため、これらの解析結果は後処理後の出力の値(有効解析結果記憶部40に記憶される値)とならず、後処理後の出力の値は初期値(図中の「−」)のままである。しかし、最初から3つ目の撮像フレームの解析結果は、過去2フレーム分の解析結果と一致するため、有効と判断される(有効性の欄の値がマル)。このため、後処理後の出力の値(有効解析結果記憶部40に記憶される値)は、3つ目の撮像フレームの解析結果の値となる。その他の撮像フレームに対しても同様の処理がなされる。
[0063] ところで、手の形状がパーの時に発生した誤った解析結果は、2フレーム分のみ連続している。上述の通り、当該実施例では、過去2フレーム分の解析結果、及び、最新の撮像フレームの解析結果のすべてが一致する場合、すなわち、同じ解析結果が3フレーム連続した場合に、その最新の撮像フレームの解析結果を有効と判断するので、2フレーム分のみしか連続していない上記誤った解析結果は無効と判断される。このため、このような誤った解析結果により、後処理後の出力の値(有効解析結果記憶部40に記憶される値)が更新されることはない。結果、このような誤った解析結果に基づく入力を排除することができる。」

(2) 引用文献3には、以下の記載がある。
「【0025】
撮像部101は、認識部309の認識対象のジェスチャを示すジェスチャ画像を撮像したり、端末装置100を所持するユーザ(教師又は生徒)の顔画像を撮像したりする。本実施形態では、認識部309の認識対象のジェスチャが挙手である場合を例に取り説明するが、これに限定されるものではない。」

「【0038】
また、認識部309により抽出された顔画像と類似する顔画像は、閾値以上の類似度であることを条件としてもよい。このようにすれば、顔ではない画像を顔画像として誤検出した場合であっても、挙手をしていないユーザの端末装置100が、投影対象画像を情報処理装置300に出力する端末として誤選択されてしまうことを防止できる。例えば、図14に示す例の場合、端末識別情報記憶部305に記憶されている顔画像522〜525のうち、認識部309により顔画像と誤検出された画像521との類似度が閾値以上のものはない。このため、画像521との類似度が最も高い顔画像523のユーザの端末装置100が、投影対象画像を情報処理装置300に出力する端末として誤選択されてしまうことを防止できる。
【0039】
なお、選択部311は、閾値の値を調整してもよい。例えば、選択部311は、図15に示すような認識精度設定画面を表示装置35上に表示し、ユーザによる入力装置36からの操作入力に基づいて、認識精度のレベルを設定することで、閾値の値を調整してもよい。このようにすれば、利用環境(明るさ等)に応じた最適な閾値を設定できる。」

第6 対比・判断
1 本願発明1について
(1)対比
本願発明1と引用発明とを対比すると、次のことがいえる。

ア 引用発明は「ジェスチャ入力判定処理について、撮像部により操作者の1フレームの画像を取得し、取得した1フレームの画像についてジェスチャ入力の検出を行なうジェスチャ入力検出処理を行ない、ジェスチャ入力検出処理は、取得した画像中のジェスチャの有無を判定すると共に、ジェスチャが有りと判定した場合は、さらにどのようなジェスチャであるのかを判定し、「どのようなジェスチャであるのか」とは、ジェスチャの内容のことであり、」「ジェスチャの検出結果の履歴保存処理が終了すると、再び画像取得処理に戻り、次のフレームについてのジェスチャ入力判定処理を行な」うから、引用発明の「過去から現在のフレームまでの所定数のジェスチャ入力の検出結果の中に、特定ジェスチャと一致するものが、閾値以上である場合にその特定ジェスチャの判定フラグをONに変更し、フラグ変更の閾値が3であるとき、現フレームを含む連続する5フレームのうち、3フレームだけ特定ジェスチャが検出されたと判定された場合に、その特定ジェスチャの判定フラグをONに変更」することにおける「過去から現在のフレームまでの所定数のジェスチャ入力の検出結果」は、「撮像部」によって収集された「連続する5フレーム」といういわゆるビデオストリームにおける時系列的に「連続する」「5フレーム」の画像に対して、それぞれ「ジェスチャの内容」を「判定」する認識処理といえる「ジェスチャ入力検出処理」を「行な」うことにより得られるものであって、「連続する5フレーム」に含まれる複数の「ジェスチャの内容」という「判定」の結果を含むものである。
したがって、引用発明の「過去から現在のフレームまでの所定数のジェスチャ入力の検出結果」、「ジェスチャ入力判定処理について、撮像部により操作者の1フレームの画像を取得し、取得した1フレームの画像についてジェスチャ入力の検出を行なうジェスチャ入力検出処理を行ない、ジェスチャ入力検出処理は、取得した画像中のジェスチャの有無を判定すると共に、ジェスチャが有りと判定した場合は、さらにどのようなジェスチャであるのかを判定し、「どのようなジェスチャであるのか」とは、ジェスチャの内容のことであり、」「過去から現在のフレームまでの所定数のジェスチャ入力の検出結果の中に、特定ジェスチャと一致するものが、閾値以上である場合にその特定ジェスチャの判定フラグをONに変更し、フラグ変更の閾値が3であるとき、現フレームを含む連続する5フレームのうち、3フレームだけ特定ジェスチャが検出されたと判定された場合に、その特定ジェスチャの判定フラグをONに変更し、」「ジェスチャの検出結果の履歴保存処理が終了すると、再び画像取得処理に戻り、次のフレームについてのジェスチャ入力判定処理を行な」うことは、それぞれ、本願発明1の「ジェスチャ認識結果シーケンス」、「カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行して、ジェスチャ認識結果シーケンスを取得することであって、前記ジェスチャ認識結果シーケンスは、前記Nフレームの画像に含まれる複数のジェスチャの認識結果を含む、こと」に相当する。

イ 上記アを踏まえると、引用発明の「過去から現在のフレームまでの所定数のジェスチャ入力の検出結果の中に、特定ジェスチャと一致するものが、閾値以上である場合にその特定ジェスチャの判定フラグをONに変更し、フラグ変更の閾値が3であるとき、現フレームを含む連続する5フレームのうち、3フレームだけ特定ジェスチャが検出されたと判定された場合に、その特定ジェスチャの判定フラグをONに変更」することは、本願発明1の「前記平滑化処理後の前記ジェスチャ認識結果シーケンスに含まれる同一ジェスチャ認識結果の数がMより大きいか等しいことに応答して、前記同一ジェスチャ認識結果が目標ジェスチャ認識結果であると決定することであって、NおよびMは、両方とも1より大きい整数であり、Nは、Mより大きいか等しい、こと」と、「前記ジェスチャ認識結果シーケンスに含まれる同一ジェスチャ認識結果の数がMより大きいか等しいことに応答して、前記同一ジェスチャ認識結果が目標ジェスチャ認識結果であると決定することであって、NおよびMは、両方とも1より大きい整数であり、Nは、Mより大きいか等しい、こと」である点で共通する。

ウ 上記イを踏まえると、引用発明の「特定ジェスチャ入力判定フラグがONであることをもって操作指示が有ったと判定し、操作指示が有ったと判定できた場合、操作対象のシステムを制御する」ことは、本願発明1の「前記目標ジェスチャ認識結果に対応する制御命令を目標機器に送信するか、または、前記目標ジェスチャ認識結果に対応する操作を実行するように目標機器を制御すること」に相当する。

エ 上記アを踏まえると、引用発明の「ジェスチャ入力判定処理について、撮像部により操作者の1フレームの画像を取得し、取得した1フレームの画像についてジェスチャ入力の検出を行なうジェスチャ入力検出処理を行ない、ジェスチャ入力検出処理は、取得した画像中のジェスチャの有無を判定すると共に、ジェスチャが有りと判定した場合は、さらにどのようなジェスチャであるのかを判定し、「どのようなジェスチャであるのか」とは、ジェスチャの内容のことであり、」「過去から現在のフレームまでの所定数のジェスチャ入力の検出結果の中に、特定ジェスチャと一致するものが、閾値以上である場合にその特定ジェスチャの判定フラグをONに変更し、フラグ変更の閾値が3であるとき、現フレームを含む連続する5フレームのうち、3フレームだけ特定ジェスチャが検出されたと判定された場合に、その特定ジェスチャの判定フラグをONに変更し、」「ジェスチャの検出結果の履歴保存処理が終了すると、再び画像取得処理に戻り、次のフレームについてのジェスチャ入力判定処理を行な」うことは、本願発明1の「前記カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行することは、前記ビデオストリーム内の単一フレームのカメラによって収集された画像を取得することであって、前記カメラによって収集された画像は、カメラ撮影視野空間に対応する画像であり、前記カメラ撮影視野空間は、ジェスチャ制御の有効空間領域を含む、ことと、前記カメラによって収集された画像から、前記ジェスチャ制御の有効空間領域に対応する部分画像領域を選択することと、前記部分画像領域に対して前記ジェスチャ認識処理を実行すること」と、「前記カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行することは、前記ビデオストリーム内の単一フレームのカメラによって収集された画像を取得することであって、」「前記」「画像に対して前記ジェスチャ認識処理を実行すること」である点で共通する。

オ 引用発明の「機器操作システムにおける方法」は、「特定ジェスチャ入力判定フラグがONであることをもって操作指示が有ったと判定し、操作指示が有ったと判定できた場合、操作対象のシステムを制御する」方法であるから、本願発明1の「ジェスチャ制御方法」に相当する。

したがって、本願発明1と引用発明との間には、次の一致点、相違点があるといえる。

(一致点)
「 ジェスチャ制御方法であって、
カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行して、ジェスチャ認識結果シーケンスを取得することであって、前記ジェスチャ認識結果シーケンスは、前記Nフレームの画像に含まれる複数のジェスチャの認識結果を含む、ことと、
前記ジェスチャ認識結果シーケンスに含まれる同一ジェスチャ認識結果の数がMより大きいか等しいことに応答して、前記同一ジェスチャ認識結果が目標ジェスチャ認識結果であると決定することであって、NおよびMは、両方とも1より大きい整数であり、Nは、Mより大きいか等しい、ことと、
前記目標ジェスチャ認識結果に対応する制御命令を目標機器に送信するか、または、前記目標ジェスチャ認識結果に対応する操作を実行するように目標機器を制御することと
を含み、
前記カメラによって収集されたビデオストリームにおける時系列的に連続するNフレームの画像に対してそれぞれジェスチャ認識処理を実行することは、
前記ビデオストリーム内の単一フレームのカメラによって収集された画像を取得することであって、
前記画像に対して前記ジェスチャ認識処理を実行することと
を含む、ジェスチャ制御方法。」

(相違点1)
本願発明1の「ジェスチャ認識結果シーケンス」に対して「前記ジェスチャ認識結果シーケンスに含まれる複数の同一ジェスチャ認識結果間に相違ジェスチャ認識結果が含まれること、かつ、前記ジェスチャ認識結果シーケンスにおける前記相違ジェスチャ認識結果の数の割合がプリセットされた値未満であることに応答して、前記相違ジェスチャ認識結果に対して」「実行することであって、前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なる」「平滑化処理」が実行されるのに対し、引用発明の「過去から現在のフレームまでの所定数のジェスチャ入力の検出結果」に対してこのような処理が実行されることについては特定されていない点。

(相違点2)
本願発明1の「ジェスチャ認識処理」が、「前記カメラによって収集された」「カメラ撮影視野空間に対応する画像であり、前記カメラ撮影視野空間は、ジェスチャ制御の有効空間領域を含む」「画像から、前記ジェスチャ制御の有効空間領域に対応する部分画像領域を選択」した「部分画像領域」に対して実行するのに対し、引用発明の「ジェスチャ入力判定処理」は、「1フレームの画像についてジェスチャ入力の検出を行なう」ものの、このような部分画像領域に対してジェスチャ入力の検出を行うことについては特定されていない点。

(2)相違点についての判断
相違点1について検討する。
「前記ジェスチャ認識結果シーケンスに含まれる複数の同一ジェスチャ認識結果間に相違ジェスチャ認識結果が含まれること、かつ、前記ジェスチャ認識結果シーケンスにおける前記相違ジェスチャ認識結果の数の割合がプリセットされた値未満であることに応答して、前記相違ジェスチャ認識結果に対して平滑化処理を実行することであって、前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なる」構成は、引用文献1−3のいずれにも記載されておらず、本願の優先日前において周知技術であったともいえない。
よって、相違点2について検討するまでもなく、本願発明1は、当業者であっても、引用発明及び引用文献2、3に記載された技術的事項に基づいて容易に発明をすることができたものであるとはいえない。

2 本願発明2−8、10、11について
本願発明2−8、10、11は、本願発明1と同一の構成を備えるものであるから、本願発明1と同じ理由により、当業者であっても、引用発明及び引用文献2、3に記載された技術的事項に基づいて容易に発明できたものとはいえない。

3 本願発明9について
本願発明9は、本願発明1に対応する「ジェスチャ制御装置」の発明であり、本願発明1とカテゴリ表現が異なるだけの発明である。したがって、本願発明9は、本願発明1の構成に対応する構成を実質的に備えるものであるから、本願発明1と同じ理由により、当業者であっても、引用発明及び引用文献2、3に記載された技術的事項に基づいて容易に発明をすることができたものとはいえない。

第7 当審拒絶理由について
令和6年2月26日付けの補正により、請求項1について、「前記ジェスチャ認識結果シーケンスに含まれる複数の同一ジェスチャ認識結果間に相違ジェスチャ認識結果が含まれること、かつ、前記ジェスチャ認識結果シーケンスにおける前記相違ジェスチャ認識結果の数の割合がプリセットされた値未満であることに応答して、前記相違ジェスチャ認識結果に対して平滑化処理を実行することであって、前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なる」と補正され、請求項9について、「前記ジェスチャ決定モジュールは、前記ジェスチャ認識結果シーケンスに含まれる複数の同一ジェスチャ認識結果間に相違ジェスチャ認識結果が含まれること、かつ、前記ジェスチャ認識結果シーケンスにおける前記相違ジェスチャ認識結果の数の割合がプリセットされた値未満であることに応答して、前記相違ジェスチャ認識結果に対して平滑化処理を実行するように構成されており、前記相違ジェスチャ認識結果は、前記同一ジェスチャ認識結果とは異なり」と補正された結果、請求項1−11は明確となり、この拒絶の理由は解消した。

第8 原査定についての判断
令和6年2月26日付けの補正により、補正後の請求項1−11は、相違点1に対応する構成を有するものとなった。
そして、当該構成は、原査定における引用文献1−3には記載されておらず、本願の優先日前における周知技術でもないので、本願発明1−11は、当業者であっても、引用文献1−3に基づいて容易に発明をすることができたものではない。
したがって、原査定を維持することはできない。

第9 むすび
以上のとおり、原査定の理由によっては、本願を拒絶することはできない。
また、他に本願を拒絶すべき理由を発見しない。
よって、結論のとおり審決する。


 
審決日 2024-04-01 
出願番号 P2021-544350
審決分類 P 1 8・ 113- WY (G06F)
P 1 8・ 121- WY (G06F)
P 1 8・ 537- WY (G06F)
最終処分 01   成立
特許庁審判長 篠塚 隆
特許庁審判官 山内 裕史
野崎 大進
発明の名称 ジェスチャ制御方法及び装置  
代理人 山本 秀策  
代理人 石川 大輔  
代理人 山本 健策  
代理人 森下 夏樹  
代理人 飯田 貴敏  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ