• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 特36条6項1、2号及び3号 請求の範囲の記載不備 取り消して特許、登録 G06F
審判 査定不服 2項進歩性 取り消して特許、登録 G06F
管理番号 1403417
総通号数 23 
発行国 JP 
公報種別 特許審決公報 
発行日 2023-11-24 
種別 拒絶査定不服の審決 
審判請求日 2022-10-31 
確定日 2023-10-30 
事件の表示 特願2020−205151「仮想アシスタントのアクティブ化」拒絶査定不服審判事件〔令和 3年 4月15日出願公開、特開2021− 61009、請求項の数(17)〕について、次のとおり審決する。 
結論 原査定を取り消す。 本願の発明は、特許すべきものとする。 
理由 第1 手続の経緯

本願は、2016年(平成28年)3月8日(パリ条約による優先権主張外国庁受理2015年3月8日 米国、2015年8月31日 米国)を国際出願日とする出願である特願2017−541898号の一部を令和2年12月10日に新たな特許出願としたものであって、その手続の経緯は、概略、以下のとおりである。

令和3年 1月 6日 :手続補正書の提出
令和3年11月19日付け:拒絶理由通知
令和4年 2月14日 :意見書、手続補正書の提出
令和4年 6月27日付け:拒絶査定(原査定)
令和4年10月31日 :拒絶査定不服審判の請求、手続補正書の提出
令和5年 6月19日付け:拒絶理由(最後)(当審拒絶理由)通知
令和5年 9月19日 :意見書、手続補正書の提出

第2 原査定の概要

原査定の概要は、次のとおりである。

進歩性)この出願の請求項1ないし4,7ないし12,14および16ないし19に係る発明は、以下の引用文献1ないし3に記載された発明に基いて、この出願の請求項5、6および13に係る発明は、以下の引用文献1ないし4に記載された発明に基いて、この出願の請求項15に係る発明は、以下の引用文献1ないし3および5に記載された発明に基いて、その出願前にその発明の属する技術の分野における通常の知識を有する者(以下、「当業者」という。)が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができない。



1.米国特許出願公開第2014/0156269号明細書
2.米国特許出願公開第2014/0379341号明細書
(周知技術を示す文献)
3.特表2012−508530号公報(周知技術を示す文献)
4.国際公開第2014/124332号
5.特開2014−127754号公報

第3 本願発明

本願請求項1ないし17に係る発明(以下、それぞれ「本願発明1」ないし「本願発明17」という。)は、令和5年9月19日に提出された手続補正書により補正された特許請求の範囲の請求項1ないし17に記載された事項により特定される、次のとおりの発明である。

「【請求項1】
ディスプレイ及びマイクロフォンを有する電子デバイスにおいて、仮想アシスタントを起動するための方法であって、
前記電子デバイスがユーザに装着されており、かつ、前記ディスプレイがオフである間に、入力デバイスを介してユーザ入力を受信することであって、前記ユーザ入力は前記電子デバイスの持ち上げを含む、受信することと、
前記ディスプレイがオフである間に、前記電子デバイスの前記持ち上げが所定の条件を満たすかどうかを判定することと、
前記電子デバイスの前記持ち上げが前記所定の条件を満たすとの判定に従って、前記ディスプレイがオフである間に前記マイクロフォンを介して受信したオーディオ入力をサンプリングすることと、
前記オーディオ入力が口頭トリガを含むかどうかを判定することと、
前記オーディオ入力が前記口頭トリガを含むとの判定に従って、
前記ディスプレイがオフである間に仮想アシスタントセッションをトリガすることと、
前記ディスプレイがオフである間に触覚出力を提供することと、
前記オーディオ入力のサンプリングが所定の持続時間発生した後、前記オーディオ入力のサンプリングを中止することと、
前記オーディオ入力のサンプリングの中止に従って、触覚出力を提供することと、
を含む方法。
【請求項2】
前記所定の条件は、前記電子デバイスの加速度計から判定された、時間インターバル中の前記電子デバイスの持ち上げ量に基づくものである、請求項1に記載の方法。
【請求項3】
前記所定の条件は、前記電子デバイスの加速度計から判定された、時間インターバル中の前記電子デバイスの持ち上げの平滑度に基づくものである、請求項1または2に記載の方法。
【請求項4】
前記所定の条件は、前記電子デバイスの前記持ち上げに従う位置での滞留時間の最小期間を含む、請求項2または3に記載の方法。
【請求項5】
前記所定の条件を満たす前記電子デバイスの持ち上げは、第1の所定の条件を満たす第1のユーザ入力であり、
前記第1のユーザ入力の受信に従い、オーディオ入力をサンプリングする間に、第2の所定の条件を満たす第2のユーザ入力を受信することと、
前記第2の所定の条件を満たす前記第2のユーザ入力の受信に従い、前記オーディオ入力のサンプリングを中止することと、を更に含む、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記第2の所定の条件は、前記電子デバイスの加速度計から判定された、時間インターバル中の前記電子デバイスの降下量に基づくものである、請求項5に記載の方法。
【請求項7】
前記第2の所定の条件は、前記電子デバイスの加速度計から判定された、時間インターバル中の前記電子デバイスの降下の平滑度に基づくものである、請求項5に記載の方法。
【請求項8】
前記第2の所定の条件は、前記電子デバイスのボタンのアクティブ化を検出することを含む、請求項5に記載の方法。
【請求項9】
前記第2の所定の条件は、前記電子デバイスのタッチ感知面上のタッチ入力を検出することを含む、請求項5に記載の方法。
【請求項10】
前記所定の条件を満たす前記電子デバイスの持ち上げの受信に従い、オーディオ入力をサンプリングしている間に、前記オーディオ入力内のオーディオ終点を特定することと、
前記オーディオ終点の特定に応じて、前記オーディオ入力のサンプリングを中止することと、を更に含む、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記仮想アシスタントセッションのトリガに従い、前記ユーザに口頭入力を促すことを更に含む、請求項1から10のいずれか一項に記載の方法。
【請求項12】
前記オーディオ入力は、前記口頭トリガと追加入力を含み、
前記仮想アシスタントセッションのトリガに従い、
前記オーディオ入力内の少なくとも前記追加入力に基づいてユーザ意図を判定することと、
前記ユーザ意図に関連付けられたタスクを実行することと、
を更に含む、請求項1から11のいずれか一項に記載の方法。
【請求項13】
前記電子デバイスが所定のモードで動作しているとの判定に従い、前記ディスプレイがオンしている間に、前記所定の条件を満たす前記電子デバイスの持ち上げを受信した後であっても、オーディオ入力のサンプリングを抑制することを更に含み、
前記所定のモードでの動作は、前記電子デバイスのオーディオ出力をミュートすることを含む、請求項1から12のいずれか一項に記載の方法。
【請求項14】
前記口頭トリガは、所定のフレーズを含む、請求項1から13のいずれか一項に記載の方法。
【請求項15】
請求項1から14のいずれか一項に記載の方法をコンピュータに実行させるコンピュータプログラム。
【請求項16】
請求項15に記載のコンピュータプログラムを記憶したメモリと、
前記メモリが記憶する前記コンピュータプログラムを実行可能な1つ以上のプロセッサと
を備える電子デバイス。
【請求項17】
請求項1から14のいずれか一項に記載の方法を実行する手段を備える電子デバイス。」

第4 引用文献の記載、引用発明等

1 引用文献1

(1)引用文献1の記載

原査定の拒絶の理由にて引用された引用文献1(米国特許出願公開第2014/0156269号明細書)には、図面とともに、次の記載がある(下線は当審による。以下同様。)。

ア 「[0002] 1. Field of the Disclosure
[0003] The disclosure relates to a portable device, and more particularly, to a method for providing a voice recognition service by switching a portable device from standby mode to voice recognition service mode using a sensor.」
(当審訳:
[0002] 1. 開示の分野
[0003] 本開示は、ポータブルデバイスに関し、より詳細には、センサを使用してポータブルデバイスをスタンバイモードから音声認識サービスモードに切り替えることによって音声認識サービスを提供する方法に関する。)

イ 図1


ウ 「[0028] FIG. 1 is a block diagram of a portable device according to an embodiment.
[0029] In the embodiment of FIG. 1, the portable device includes a storage unit 1010, a communication unit 1020, a sensor unit 1030, an audio Input/Output (I/O) unit 1040, a camera unit 1050, a display unit 1060, a power unit 1070, a processor 1080, and a controller 1090.
(中略)
[0033] The sensor unit 1030 may recognize a user input or a device environment by using a plurality of sensors equipped in the portable device and provide the recognized result to the controller 1090. The sensor unit 1030 may include a plurality of sensing means. In an embodiment, the plurality of sensing means may include a gravity sensor, a geomagnetic sensor, a gyro sensor, an acceleration sensor, an inclination sensor, an illuminance sensor, an altitude sensor, an odor sensor, a temperature sensor, a depth sensor, a pressure sensor, a bending sensor, an audio sensor, a video sensor, a Global Positioning System (GPS) sensor, a touch sensor, a mechanical vibration sensor, etc. The sensor unit 1030 generically refers to such various sensing means. The sensor unit 1030 may sense various user inputs and user environments and provide sensing results so that the portable device may perform operations corresponding to the sensing results. The above-described sensors may be included as separate elements or may be incorporated into one or more elements in the portable device.
(中略)
[0035] The audio I/O unit 1040 may include audio output means such as a speaker and audio input means such as a microphone and thus may be responsible for audio input and output of the portable device. The audio input unit 1040 may be used as an audio sensor or a speech sensor, like a microphone. The audio output unit 1040 may be used as a speaker for outputting voice or sound.」
(当審訳:
[0028] 図1は、実施形態に係るポータブルデバイスのブロック図である。
[0029] 図1の実施形態において、ポータブルデバイスは、ストレージユニット1010、通信ユニット1020、センサユニット1030、オーディオ入出力(I/O)ユニット1040、カメラユニット1050、ディスプレイユニット1060、電源ユニット1070、プロセッサ1080、およびコントローラ1090を含む。
(中略)
[0033] センサユニット1030は、ポータブルデバイスに装備された複数のセンサを使用して、ユーザ入力またはデバイス環境を認識し、認識した結果をコントローラ1090に提供することができる。センサユニット1030は、複数のセンシング手段を含んでもよい。実施形態において、複数のセンシング手段は、重力センサ、地磁気センサ、ジャイロセンサ、加速度センサ、傾斜センサ、照度センサ、高度センサ、匂いセンサ、温度センサ、深度センサ、圧力センサ、屈曲センサ、音声センサ、映像センサ、全地球測位システム(GPS)センサ、接触センサ、機械振動センサ、などを含むことがある。センサユニット1030は、このような様々なセンシング手段を総称している。センサユニット1030は、様々なユーザ入力及びユーザ環境を感知し、携帯端末が感知結果に対応する動作を実行できるように感知結果を提供してもよい。上述のセンサは、別個の要素として含まれてもよいし、ポータブルデバイスの1つまたは複数の要素に組み込まれてもよい。
(中略)
[0035] オーディオ入出力ユニット1040は、スピーカなどの音声出力手段やマイクなどの音声入力手段を含むため、ポータブルデバイスの音声入出力を担当することができる。音声入力ユニット1040は、マイクのような音声センサや音声センサとして使用することができる。また、音声出力部1040は、音声や音を出力するためのスピーカとして使用することができる。)

エ 「[0045] In the absence of a user input for a predetermined time or longer or upon receipt of a specific user input, the portable device may switch from the active mode 2020 to the standby mode 2010. On the other hand, upon sensing a specific user input or upon occurance of a specific event, the portable device may switch from the standby mode 2010 to the active mode 2020. In an embodiment, the portable device may minimize power consumption in the standby mode 2010 by placing elements such as the display, at least one sensor, the main processor, etc. in the inactive state. However, elements required for the portable device to switch from the standby mode 2010 to the active mode 2020 should stay in the active state.」
(当審訳:
[0045] 所定の時間以上ユーザ入力がない場合、または特定のユーザ入力を受信した場合、ポータブルデバイスはアクティブモード2020からスタンバイモード2010に切り替わることがある。一方、特定のユーザ入力を感知したとき、または特定のイベントが発生したとき、ポータブルデバイスは、スタンバイモード2010からアクティブモード2020に切り替わることがある。実施形態において、ポータブルデバイスは、ディスプレイ、少なくとも1つのセンサ、メインプロセッサなどの要素を非活性状態に置くことによって、スタンバイモード2010における電力消費を最小化することができる。しかし、ポータブルデバイスがスタンバイモード2010からアクティブモード2020に切り替わるために必要な要素は、アクティブ状態に留まるべきである。)

オ 図3


カ 「[0046] When the portable device is in the active mode 2020, the portable device may provide various functions. In an embodiment, the portable device may provide a voice recognition service. The voice recognition service refers to a service of recognizing a user's voice command by voice recognition technology, performing an operation corresponding to the recognized voice command, and providing the result of the operation according to the disclosure. Although the portable device may provide the voice recognition service in the active mode 2020, the portable device may not need to place all elements in the active state, for the voice recognition service. For example, even though the touch sensor is placed in the inactive state, the voice recognition service is available by the portable device. If the voice recognition service provides information other than visual information, the portable device may deactivate the display unit, thereby reducing power consumption. Considering that the voice recognition service can be used often as a personal assistant function or an intelligent agent, the portable device may be designed in such a manner that it can switch from the standby mode directly to voice recognition service mode, as described below.
[0047] FIG. 3 is a diagram illustrating the operation modes of the portable device according to an embodiment.
(中略)
[0049] When the portable device is in the standby mode 3010, the portable device may directly switch from the standby mode 3010 to the voice service mode 3030, upon receipt of a specific input for entering the voice service mode 3030. The specific input may be, for example, a gesture, a voice command, etc. issued for the portable device. When a specific input for switching from the standby mode 3010 to the voice service mode 3030 is a gesture to the portable device, the gesture may be referred to as a voice recognition service triggering gesture. Hereinbelow, the voice recognition service triggering gesture may be referred to shortly as a voice service triggering gesture.


(当審訳:
[0046] ポータブルデバイスがアクティブモード2020にあるとき、ポータブルデバイスは様々な機能を提供することができる。一実施形態では、ポータブルデバイスは、音声認識サービスを提供することができる。音声認識サービスとは、音声認識技術によってユーザの音声コマンドを認識し、認識された音声コマンドに対応する動作を行い、動作の結果を本開示に従って提供するサービスのことをいう。ポータブルデバイスは、アクティブモード2020で音声認識サービスを提供することができるが、ポータブルデバイスは、音声認識サービスのために、すべての要素をアクティブ状態に置く必要はない場合がある。例えば、タッチセンサが非アクティブ状態に配置されても、ポータブルデバイスによって音声認識サービスは利用可能である。音声認識サービスが視覚情報以外の情報を提供する場合、ポータブルデバイスはディスプレイユニットを非活性化することができ、それによって電力消費を低減することができる。音声認識サービスがパーソナルアシスタント機能またはインテリジェントエージェントとして頻繁に使用され得ることを考慮すると、ポータブルデバイスは、以下に説明するように、スタンバイモードから音声認識サービスモードに直接切り替えることができるように設計され得る。
[0047] 図3は、実施形態によるポータブルデバイスの動作モードを説明するための図である。
(中略)
[0049] ポータブルデバイスがスタンバイモード3010にあるとき、ポータブルデバイスは、音声サービスモード3030に入るための特定の入力を受信すると、スタンバイモード3010から音声サービスモード3030に直接切り替えることができる。特定の入力は、例えば、ポータブルデバイスに対して発せられるジェスチャー、音声コマンド等であってもよい。スタンバイモード3010から音声サービスモード3030に切り替えるための特定の入力が、ポータブルデバイスに対するジェスチャーである場合、そのジェスチャーは、音声認識サービストリガージェスチャーと称されることがある。以下では、音声認識サービストリガージェスチャーを音声サービストリガージェスチャーと略称することがある。)

(2)引用文献1記載発明

上記(1)より、特に、下線部に着目すると、引用文献1には、以下の発明(以下、「引用発明」という。)が記載されていると認められる。

「センサを使用してポータブルデバイスをスタンバイモードから音声認識サービスモードに切り替えることによって音声認識サービスを提供する方法に関し、
ポータブルデバイスは、ストレージユニット1010、通信ユニット1020、センサユニット1030、オーディオ入出力(I/O)ユニット1040、カメラユニット1050、ディスプレイユニット1060、電源ユニット1070、プロセッサ1080、およびコントローラ1090を含んでおり、
センサユニット1030は、複数のセンシング手段を含んでおり、複数のセンシング手段は、重力センサ、地磁気センサ、ジャイロセンサ、加速度センサ、傾斜センサ、照度センサ、高度センサ、匂いセンサ、温度センサ、深度センサ、圧力センサ、屈曲センサ、音声センサ、映像センサ、全地球測位システム(GPS)センサ、接触センサ、機械振動センサ、などを含んでおり、
オーディオ入出力ユニット1040は、スピーカなどの音声出力手段やマイクなどの音声入力手段を含むため、ポータブルデバイスの音声入出力を担当することができるものであり、
所定の時間以上ユーザ入力がない場合、または特定のユーザ入力を受信した場合、ポータブルデバイスはアクティブモード2020からスタンバイモード2010に切り替わることがあり、ポータブルデバイスは、ディスプレイなどの要素を非活性状態に置くことによって、スタンバイモード2010における電力消費を最小化することができるものであり、
ポータブルデバイスは、音声認識サービスを提供することができ、音声認識サービスとは、音声認識技術によってユーザの音声コマンドを認識し、認識された音声コマンドに対応する動作を行い、動作の結果を提供するサービスであり、
ポータブルデバイスがスタンバイモード3010にあるとき、ポータブルデバイスは、音声サービスモード3030に入るための特定の入力を受信すると、スタンバイモード3010から音声サービスモード3030に直接切り替えることができ、スタンバイモード3010から音声サービスモード3030に切り替えるための特定の入力が、ポータブルデバイスに対するジェスチャーである場合、そのジェスチャーは、音声認識サービストリガージェスチャーと称される
音声認識サービスを提供する方法。」

2 引用文献2

原査定の拒絶の理由にて引用された引用文献2(米国特許出願公開第2014/0379341号明細書)には、図面とともに、次の記載がある。

ア 図7A


イ 「[0129] Referring to FIG. 7A, FIG. 7A is a view illustrating an example of a case where a user wears a portable terminal on the wrist, and a user 710 wears an attachable portable terminal 720 on the left hand. The portable terminal 720 may include a belt, a string, and the like so as to be attached to a target, such as an arm or a leg. Further, the user 710 may generally walk or run, and the portable terminal 720 may detect such a movement through the sensor module 170. When the movement is detected as described above, the portable terminal 720 may determine whether the movement is a movement for controlling the operation or the function of the portable terminal 720. As a basis of the determination, the portable terminal 720 may determine whether the movement is a movement for controlling the operation or the function of the portable terminal 720 by storing a moving pattern in daily life and comparing the stored moving pattern with the movement, or through various information, such as a speed, an altitude, an angle, and the like detected by the sensor module 170.

(当審訳:
[0129] 図7Aを参照して、図7Aは、ユーザが携帯端末を手首に装着し、ユーザ710が装着可能な携帯端末720を左手に装着する場合の例を示す図である。携帯端末720は、腕や足などの対象物に装着されるように、ベルトや紐などを含んでいてもよい。さらに、ユーザ710は一般に歩いたり走ったりすることがあり、携帯端末720はセンサモジュール170を介してそのような動きを検出することができる。上記のように動きが検出されると、携帯端末720は、その動きが携帯端末720の動作または機能を制御するための動きであるか否かを判定することができる。携帯端末720は、その判断の根拠として、日常生活における移動パターンを記憶しておき、その記憶された移動パターンと移動とを比較することによって、あるいは、センサモジュール170によって検出された速度、高度、角度などの各種情報によって、その移動が携帯端末720の動作または機能を制御するための移動であるか否かを判断することができる。)

ウ 図7B


エ 「[0130] Referring to FIG. 7B, FIG. 7B is a view illustrating an example of a case where a hand wearing the portable terminal is bent in the front direction, and when the user 720 bends a left arm wearing the portable terminal 720 in the front direction, the portable terminal 720 recognizes generation of a movement or a gesture from the state of FIG. 7A to the state of FIG. 7B. In the present embodiment, the gesture of bending the left arm wearing the portable terminal in the front direction is described, but is only the exemplary embodiment, and the present disclosure includes various gestures by which the portable terminal moves. With respect to the various gestures, a different gesture may be mapped according to an attribute of a function desired to be executed through the portable terminal 720. That is, as if the voice recognition module is activated when the user bends the arm wearing the portable terminal 720 in the front direction, when the user wears the portable terminal 720 on an ankle, a module for calculating a step whenever the user walks may be activated. As described above, the present disclosure may execute a predetermined function according to the movement of the portable terminal 720.」
(当審訳:
[0130] 図7Bを参照して、図7Bは、携帯端末を装着した手を正面方向に曲げた場合の一例を示す図であり、ユーザ720が携帯端末720を装着した左腕を正面方向に曲げると、携帯端末720は、図7Aの状態から図7Bの状態への移動またはジェスチャの生成を認識する。なお、本実施形態では、携帯端末を装着した左腕を前方向に曲げるジェスチャについて説明したが、これは例示的な実施形態に過ぎず、本開示には、携帯端末が移動する様々なジェスチャが含まれる。様々なジェスチャに関して、携帯端末720を通じて実行されることが望まれる機能の属性に応じて、異なるジェスチャがマッピングされ得る。すなわち、ユーザが携帯端末720を装着した腕を前方向に曲げたときに音声認識モジュールが起動されるように、ユーザが携帯端末720を足首に装着したときに、ユーザが歩くたびに歩数を計算するモジュールが起動されてもよい。以上のように、本開示は、携帯端末720の動きに応じて所定の機能を実行してもよい。)

3 引用文献3

原査定の拒絶の理由にて引用された引用文献3(特表2012−508530号公報)には、図面とともに、次の記載がある。

ア 図1


イ 「【0015】
図1は、多感覚応用音声検出を示す概念図100である。図100は、モバイルデバイス110を手に持っているユーザー105を示している。モバイルデバイス110は、携帯電話、PDA、ラップトップコンピュータ、または他の適切なポータブルコンピューティングデバイスであってもよい。図1に示されている図解例において、ユーザー105は、モバイルデバイス110上で実行されているアプリケーションをインタラクティブに操作することを望んでいる場合がある。例えば、ユーザーは、GOOGLE MAPSなどのウェブベースのアプリケーションを使用して会社の住所を検索したい場合がある。典型的には、ユーザー105は、モバイルデバイス110を使用して、会社の名称を適切なウェブサイト上の検索ボックスに入力し、検索を実行する。しかし、ユーザー105は、デバイス110を使用して必要な情報をウェブサイトの検索ボックスに入力したくないか、または入力することができないことがある。
【0016】
図1に示されている多感覚応用音声検出の図解例において、ユーザー105は、検索を実行するのに、モバイルデバイス110をただ単に自然な操作位置に置き、検索語を言うだけでよい。例えば、いくつかの実装において、デバイス110は、デバイス110の向きを識別することによって、録音を開始もしくは終了することができる。録音された音声(または録音された音声に対応するテキスト)を、選択された検索アプリケーションに入力として供給することができる。
【0017】
図1の文字「A」、「B」、および「C」は、多感覚応用音声検出の図解例における異なる状態を表している。状態Aでは、ユーザー105は、デバイス110を非動作位置に保持している、つまり、所定の角度を外れる位置、またはユーザー105から離れすぎている位置、または場合によっては、その両方の位置に保持している。例えば、使用している間、ユーザー105は、デバイス110を図1に示されているように自分のそばに保持するか、またはデバイスをポケットもしくはバッグの中に入れておくことができる。デバイス110が、そのような向きである場合、デバイス110は、使用中でないと思われ、ユーザー105がモバイルデバイス110に向かって発声していることはありえない。そのようなものとして、デバイス110は、非録音モードに置かれるものとしてよい。
【0018】
ユーザー105が、デバイス110を使用したい場合、ユーザー105は、デバイス110を動作モード/位置にすることができる。図100に示されている図解例において、デバイス110は、姿勢と称される、選択された動作位置に置かれる時を判定することができる。状態Bは、モバイルデバイス110がいくつかの例示的な姿勢にあることを示している。例えば、状態Bの一番左の図は、「電話姿勢」115を示している。電話姿勢は、いくつかの実装において、ユーザー105がモバイルデバイス110を電話口に発声するために一般に使用される位置に保持していることに対応しうる。例えば、図1に示されているように、デバイス110をユーザー105の頭部の横に保持し、デバイス110のスピーカーをユーザー105の耳の近くに保持するものとしてよい。デバイス110をこのように保持することで、ユーザー105がデバイス110から発せられる音声を聞き取り、デバイス110に接続されているマイクロホンに発声することがしやすくなるものとしてよい。
【0019】
状態Bに示されている真ん中の図は、ユーザー105がデバイス110を「PDA姿勢」120に保持していることを表している。例えば、図1に示されているように、PDA姿勢120は、ユーザー105がモバイルデバイス110をほぼ腕の長さ分のところに保持し、ユーザー105がモバイルデバイス110を見て、インタラクティブに操作できる位置に保持していることに対応しているものとしてよい。例えば、この位置では、ユーザー105は、デバイス110のキーパッド上のボタン、またはデバイス110の画面上に表示される仮想キーボード上のボタンを押すことができる。場合によっては、ユーザー105は、この位置で音声コマンドをデバイス110に入力することもできる。
【0020】
最後に、状態Bの一番右の図は、「トランシーバー姿勢」125を示している。場合によっては、トランシーバー姿勢125は、ユーザー105がモバイルデバイス110を自分の顔の前に持ってきて、デバイス110のマイクロホンをユーザー105の口に近づける状態を含むものとしてよい。この位置では、ユーザー105はデバイス110のマイクロホンに直接発声しつつ、デバイス110に結合されているスピーカーホンから発せられる音を聞くこともできる。
【0021】
図1は3つの姿勢を示しているけれども、他の姿勢も使用することができる。例えば、代替的実装において、モバイルデバイスが開かれているのか、それとも閉じられているのかを考慮するできる姿勢であってもよい。例えば、図1に示されているモバイルデバイス110は、「折り畳み式携帯電話」、つまり、ヒンジを使用して折り畳んだり、拡げたりできる2つまたはそれ以上の部分(典型的には蓋と基部)を備えるフォームファクタを有する電話機とすることができる。これらのデバイスのうちのいくつかについて、姿勢に、電話機の向きに加えて(または代わりに)、電話機が開いているか、または閉じているかの状態を含めることができる。例えば、モバイルデバイス110が折り畳み式携帯電話である場合、図1に示されている電話姿勢115は、デバイスが開いているという状態を含むことができる。ここで取りあげている例は、折り畳み式携帯電話について説明しているけれども、他のタイプもしくはフォームファクタ(例えば、旋回する、もしくはスライドさせて開く電話機)を使用することもできる。
【0022】
デバイス110が、所定の姿勢にあると識別された場合、デバイス110は、ユーザー115からの音声などの聴覚情報の記録を開始することができる。例えば、状態Cは、デバイス110が電話姿勢にある間にユーザーがデバイス110に向かって発声している状態を示している。いくつかの実装では、デバイス110は、デバイス110が電話姿勢115で検出されたときに聴覚情報の記録を開始することができるため、デバイス110は、ユーザー105が発声を開始する直前に(または開始したとたんに)録音を開始することができる。そのようなものとして、デバイス110は、ユーザーの発声の開始をキャプチャすることができる。
【0023】
デバイス110が姿勢から外れると、デバイス110は録音を停止することができる。例えば、図1に示されている例では、ユーザー105がデバイス110への発声を終了した後、ユーザー105は、例えば、デバイス110を状態Aに示されているように自分の横に置くことによってデバイス110を非動作位置に戻すことができる。デバイス110が姿勢(この例では電話姿勢115)から外れると、デバイス110は録音を停止することができる。例えば、デバイス110が、選択された一組の角度の範囲外にあり、および/またはユーザー105から離れすぎた場合に、デバイス110は、その録音動作を停止することができる。場合によっては、この時点までにデバイス110によって記録された情報は、そのデバイス上で、またはリモートデバイス上で実行されているアプリケーションに供給することができる。例えば、上記のように、聴覚情報をテキストに変換し、デバイス110によって実行されている検索アプリケーションに供給することができる。」

4 引用文献4

原査定の拒絶の理由にて引用された引用文献4(国際公開第2014/124332号)には、図面とともに、次の記載がある。

「[0103] In some implementations, the sound-type detector 404 operates according to a duty cycle. In some implementations, the sound-type detector 404 is on for 20 milliseconds and off for 100 milliseconds. Other on and off durations are also possible. In some implementations, the sound-type detector 404 is able to determine whether a sound input corresponds to a predetermined type of sound within the "on" interval of its duty cycle. Thus, the sound-type detector 404 will initiate the trigger sound detector 406 (or any other upstream sound detector) if the sound-type detector 404 determines, during its "on" interval, that the sound is of a certain type. Alternatively, in some implementations, if the sound-type detector 404 detects, during the "on" interval, sound that may correspond to the predetermined type, the detector will not immediately enter the "off interval. Instead, the sound-type detector 404 remains active and continues to process the sound input and determine whether it corresponds to the predetermined type of sound. In some implementations, if the sound detector determines that the predetermined type of sound has been detected, it initiates the trigger sound detector 406 to further process the sound input and determine if the trigger sound has been detected. Similar to the noise detector 402 and the sound-type detector 404, in some implementations, the trigger sound detector 406 operates according to a duty cycle. In some implementations, the trigger sound detector 406 is on for 50 milliseconds and off for 50 milliseconds. Other on and off durations are also possible. If the trigger sound detector 406 detects, during its "on" interval, that there is sound that may correspond to a trigger sound, the detector will not immediately enter the "off interval. Instead, the trigger sound detector 406 remains active and continues to process the sound input and determine whether it includes the trigger sound. In some implementations, if such a sound is detected, the trigger sound detector 406 remains active to process the audio for a predetermined duration, such as 1, 2, 5, or 10 seconds, or any other appropriate duration. In some implementations, the duration is selected based on the length of the particular trigger word or sound that it is configured to detect. For example, if the trigger phrase is "Hey, SIRI," the trigger word detector is operated for about 2 seconds to determine whether the sound input includes that phrase.」
(当審訳:
[0103] いくつかの実施態様では、音型検出器 404 はデューティサイクルに従って動作する。いくつかの実装では、音型検出器404は20ミリ秒間オンで100ミリ秒間オフである。他のオンとオフの持続時間も可能である。いくつかの実施態様では、音型検出器404は、そのデューティサイクルの「オン」間隔内に、音入力が所定の種類の音に対応するかどうかを判定することができる。従って、音型検出器404は、その「オン」インターバル中に、音が特定のタイプであると判定した場合、トリガー音型検出器406(または他の上流の音型検出器)を起動する。あるいは、いくつかの実装では、音型検出器404が「オン」区間中に、所定のタイプに対応する可能性のある音を検出した場合、検出器は直ちに「オフ」区間に入らない。その代わりに、音型検出器404はアクティブのまま、音の入力を処理し続け、それが所定の種類の音に対応するかどうかを判定する。いくつかの実装では、音型検出器が所定の種類の音が検出されたと判断した場合、トリガー音検出器406を起動し、さらに音の入力を処理し、トリガー音が検出されたかどうかを判断する。ノイズ検出器402および音型検出器404と同様に、いくつかの実装では、トリガ音検出器406はデューティサイクルに従って動作する。いくつかの実装では、トリガー音検出器406は50ミリ秒オン、50ミリ秒オフである。他のオンとオフの持続時間も可能である。トリガー音検出器406が、その「オン」インターバル中に、トリガー音に対応する可能性のある音があることを検出した場合、検出器は直ちに「オフ」インターバルに入らない。代わりに、トリガー音検出器406はアクティブのまま、音入力を処理し続け、トリガー音が含まれているかどうかを判断します。いくつかの実装では、そのような音が検出された場合、トリガー音検出器406は、1秒、2秒、5秒、10秒などの所定の継続時間、または他の適切な継続時間の間、音声を処理するためにアクティブな状態を維持します。いくつかの実装では、継続時間は、検出するように構成された特定のトリガー語句または音の長さに基づいて選択される。例えば、トリガーフレーズが "Hey, SIRI "の場合、トリガーワード検出器は約2秒間動作し、入力された音がそのフレーズを含むかどうかを判断する。)

5 引用文献5

原査定の拒絶の理由にて引用された引用文献5(特開2014−127754号公報)には、図面とともに、次の記載がある。

ア 図18


イ 「【0162】
ミュート設定がされている場合(S501:YES)、制御部21は、マイクロフォン5に対する音声入力を遮断する(S502)。そして、制御部21は、図18の右下の図に示すようにミュートアイコン114が強調された状態の通話画面T1をディスプレイ3に表示する(S205)。なお、ユーザによりミュートアイコン114に対するタップ操作がなされると、制御部21は、マイクロフォン5に対する音声入力の遮断を解除する。」

第5 対比・判断

1 本願発明1

(1)対比

本願発明1と、引用発明とを対比する。

ア 引用発明において、「ポータブルデバイスは、ストレージユニット1010、通信ユニット1020、センサユニット1030、オーディオ入出力(I/O)ユニット1040、カメラユニット1050、ディスプレイユニット1060、電源ユニット1070、プロセッサ1080、およびコントローラ1090を含んでおり、」「オーディオ入出力ユニット1040は、スピーカなどの音声出力手段やマイクなどの音声入力手段を含むため、ポータブルデバイスの音声入出力を担当することができるものであ」り、「ポータブルデバイスは、音声認識サービスを提供することができ、音声認識サービスとは、音声認識技術によってユーザの音声コマンドを認識し、認識された音声コマンドに対応する動作を行い、動作の結果を提供するサービスであ」り、「ポータブルデバイスがスタンバイモード3010にあるとき、ポータブルデバイスは、音声サービスモード3030に入るための特定の入力を受信すると、スタンバイモード3010から音声サービスモード3030に直接切り替えることができ、スタンバイモード3010から音声サービスモード3030に切り替えるための特定の入力が、ポータブルデバイスに対するジェスチャーである場合、そのジェスチャーは、音声認識サービストリガージェスチャーと称される」とされている。

ここで、引用発明の「ディスプレイユニット1060」、「マイクなどの音声入力手段」、「ポータブルデバイス」は、それぞれ、本願発明1の「ディスプレイ」、「マイクロフォン」、「電子デバイス」に相当する。

また、引用発明の「ポータブルデバイス」が提供している「音声認識サービス」は、「音声認識技術によってユーザの音声コマンドを認識し、認識された音声コマンドに対応する動作を行い、動作の結果を提供するサービスであ」り、このような「音声認識サービス」は、一般に、「仮想アシスタント」サービスと呼ばれる。

さらに、引用発明の「ポータブルデバイス」は、「音声サービスモード3030に入るための特定の入力」である「音声認識サービストリガージェスチャー」を「受信すると、」「音声認識サービス」が提供される「音声サービスモード3030に直接切り替」わるから、引用発明の方法も、本願発明1と同様に、「仮想アシスタントを起動するための方法」であるといえる。

したがって、本願発明1と、引用発明とは、「ディスプレイ及びマイクロフォンを有する電子デバイスにおいて、仮想アシスタントを起動するための方法」である点で共通しているといえる。

イ 引用発明では、「所定の時間以上ユーザ入力がない場合、または特定のユーザ入力を受信した場合、ポータブルデバイスはアクティブモード2020からスタンバイモード2010に切り替わることがあり、ポータブルデバイスは、ディスプレイなどの要素を非活性状態に置くことによって、スタンバイモード2010における電力消費を最小化することができるものであり、」「ポータブルデバイスがスタンバイモード3010にあるとき、ポータブルデバイスは、音声サービスモード3030に入るための特定の入力を受信すると、スタンバイモード3010から音声サービスモード3030に直接切り替えることができ、スタンバイモード3010から音声サービスモード3030に切り替えるための特定の入力が、ポータブルデバイスに対するジェスチャーである場合、そのジェスチャーは、音声認識サービストリガージェスチャーと称される」とされている。

ここで、引用発明の「ディスプレイなどの要素を非活性状態に置くこと」は、本願発明1の「ディスプレイがオフである」ことに相当する。

また、引用発明の「ポータブルデバイスがスタンバイモード3010にあるとき、ポータブルデバイスは、音声サービスモード3030に入るための特定の入力」である「音声認識サービストリガージェスチャー」を受信することは、本願発明1の「入力デバイスを介してユーザ入力を受信すること」に対応するといえる。

したがって、本願発明1と引用発明とは、「ディスプレイがオフである間に、入力デバイスを介してユーザ入力を受信することと、前記電子デバイス」「が前記所定の条件を満たすとの判定に従って、前記ディスプレイがオフである間に前記マイクロフォンを介して受信したオーディオ入力を」受信することと、「を含む方法」である点で共通しているといえる。

しかし、本願発明1では、電子デバイスが「ユーザに装着されて」いるのに対し、引用発明では、そのような構成を備えていない点で相違している。

また、本願発明1では、ユーザ入力が、「電子デバイスの持ち上げを含む」ものであるのに対し、引用発明では、そのような構成を備えていない点で相違している。

さらに、本願発明1では、「オーディオ入力をサンプリングすることと、
前記オーディオ入力が口頭トリガを含むかどうかを判定することと、
前記オーディオ入力が前記口頭トリガを含むとの判定に従って、
前記ディスプレイがオフである間に仮想アシスタントセッションをトリガすることと」を含んでいるのに対し、引用発明では、そのような構成を含んでいない点で相違している。

(2)一致点・相違点

本願発明1と、引用発明とは、以下アの点で一致し、以下イの点で相違する。

ア 一致点

「ディスプレイ及びマイクロフォンを有する電子デバイスにおいて、仮想アシスタントを起動するための方法であって、
前記ディスプレイがオフである間に、入力デバイスを介してユーザ入力を受信することと、
前記ディスプレイがオフである間に、前記電子デバイスが所定の条件を満たすかどうかを判定することと、
前記電子デバイスが前記所定の条件を満たすとの判定に従って、前記ディスプレイがオフである間に前記マイクロフォンを介して受信すること
を含む方法。」

イ 相違点

(ア) <相違点1>

本願発明1では、電子デバイスが「ユーザに装着されて」いるのに対し、引用発明では、そのような構成を備えていない点。

(イ) <相違点2>

本願発明1では、ユーザ入力が、「電子デバイスの持ち上げを含む」ものであるのに対し、引用発明では、そのような構成を備えていない点。

(ウ) <相違点3>

本願発明1では、「前記ディスプレイがオフである間に触覚出力を提供することと、
前記オーディオ入力のサンプリングが所定の持続時間発生した後、前記オーディオ入力のサンプリングを中止することと、
前記オーディオ入力のサンプリングの中止に従って、触覚出力を提供することと」を含んでいるのに対し、引用発明では、そのような構成を備えていない点。

(エ) <相違点4>

本願発明1では、「オーディオ入力をサンプリングすることと、
前記オーディオ入力が口頭トリガを含むかどうかを判定することと、
前記オーディオ入力が前記口頭トリガを含むとの判定に従って、
前記ディスプレイがオフである間に仮想アシスタントセッションをトリガすることと」を含んでいるのに対し、引用発明では、そのような構成を含んでいない点。

(3)相違点についての判断

事案に鑑みて、先に、<相違点3>について検討する。

ア 引用文献1ないし5には、いずれも、本願発明1の<相違点3>に係る構成である、「前記ディスプレイがオフである間に触覚出力を提供すること」、「前記オーディオ入力のサンプリングが所定の持続時間発生した後、前記オーディオ入力のサンプリングを中止すること」、「前記オーディオ入力のサンプリングの中止に従って、触覚出力を提供すること」について、記載も示唆も無く、また、当該構成が本願優先日前に周知であったとも認められない。

したがって、引用発明および引用文献2ないし5に記載の技術に基づいて、当業者は、本願発明1の<相違点3>に係る構成を容易に想到することができない。

イ 以上から、上記<相違点1><相違点2>および<相違点4>について判断するまでもなく、本願発明1は、引用発明および引用文献2ないし5に記載の技術に基づいて、当業者が容易に発明できたものであるとはいえない。

2 本願発明2ないし14

本願発明2ないし14は、いずれも、本願発明1を引用したものであって、本願発明1と同一の発明特定事項を備えるものであるから、上記1の本願発明1と同じ理由により、引用発明および引用文献2ないし5に記載の技術に基づいて、当業者が容易に発明できたものであるとはいえない。

3 本願発明15ないし17

本願発明15は、本願発明1の構成を引用しつつ、本願発明1の発明のカテゴリを、単に、方法の発明から、方法をコンピュータに実行させるコンピュータプログラムの発明へと変更したものであり、本願発明16は、本願発明1の構成を引用しつつ、本願発明1の発明のカテゴリを、単に、方法の発明から、方法をコンピュータに実行させるコンピュータプログラムを記憶したメモリを備える電子デバイスの発明へと変更したものであり、本願発明17は、本願発明1の構成を引用しつつ、本願発明1の発明のカテゴリを、単に、方法の発明から、方法を実行する手段を備える電子デバイスの発明へと変更したものであるから、上記1で述べた本願発明1と同様の理由により、引用発明および引用文献2ないし5に記載の技術に基づいて、当業者が容易に発明できたものであるとはいえない。

第6 原査定についての判断

上記第5のとおり、本願発明1ないし17は、いずれも、引用発明および引用文献2ないし5に記載の技術に基づいて、当業者が容易に発明できたものであるとはいえない。

よって、原査定の拒絶の理由(進歩性)は理由がない。

したがって、原査定を維持することはできない。

第7 当審拒絶理由について

1 当審拒絶理由

当審が令和5年6月19日付けで通知した当審拒絶理由(最後)は次のとおりである。

明確性)この出願は、特許請求の範囲の記載が下記の点で、特許法第36条第6項第2号に規定する要件を満たしていない。



請求項1の「前記オーディオ入力が前記口頭トリガを含むとの判定に従って、
前記ディスプレイがオフである間に仮想アシスタントセッションをトリガすることと、
前記ディスプレイがオフである間に触覚出力を提供することと」という記載において、「仮想アシスタントセッションをトリガすること」と「触覚出力を提供すること」の技術的関連が不明瞭であるため、「触覚出力を提供すること」の技術的意義が不明瞭となっている。

請求項1を引用する請求項2ないし5も同様に不明瞭な記載となっている。
また、請求項6を引用しない、請求項7ないし19も同様に不明瞭な記載となっている。

2 検討

これに対し、令和5年9月19日に提出された手続補正書による補正により、「前記ディスプレイがオフである間に触覚出力を提供することと」の
記載の後に「前記オーディオ入力のサンプリングが所定の持続時間発生した後、前記オーディオ入力のサンプリングを中止することと、
前記オーディオ入力のサンプリングの中止に従って、触覚出力を提供することと」という限定が付加されたとことにより、「仮想アシスタントセッションをトリガすること」と「触覚出力を提供すること」の技術的関連が明瞭となった。

したがって、当審拒絶理由通知の上記理由(明確性)は解消した。

第8 むすび

以上のとおり、原査定の理由によって、本願を拒絶することはできない。
また、他に本願を拒絶すべき理由を発見しない。
よって、結論のとおり審決する。

 
審決日 2023-10-17 
出願番号 P2020-205151
審決分類 P 1 8・ 121- WY (G06F)
P 1 8・ 537- WY (G06F)
最終処分 01   成立
特許庁審判長 山澤 宏
特許庁審判官 富澤 哲生
野崎 大進
発明の名称 仮想アシスタントのアクティブ化  
代理人 弁理士法人大塚国際特許事務所  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ