• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 全部申し立て 特36条6項1、2号及び3号 請求の範囲の記載不備  G05D
審判 全部申し立て 特36条4項詳細な説明の記載不備  G05D
審判 全部申し立て ただし書き1号特許請求の範囲の減縮  G05D
審判 全部申し立て ただし書き3号明りょうでない記載の釈明  G05D
審判 全部申し立て 発明同一  G05D
審判 全部申し立て 2項進歩性  G05D
管理番号 1393041
総通号数 13 
発行国 JP 
公報種別 特許決定公報 
発行日 2023-01-27 
種別 異議の決定 
異議申立日 2020-02-27 
確定日 2022-10-18 
異議申立件数
訂正明細書 true 
事件の表示 特許第6567205号発明「機械学習装置、補正パラメータ調整装置および機械学習方法」の特許異議申立事件について、次のとおり決定する。 
結論 特許第6567205号の明細書、特許請求の範囲を訂正請求書に添付された訂正明細書、特許請求の範囲のとおり、訂正後の請求項〔1〜10〕、11について訂正することを認める。 特許第6567205号の請求項1〜11に係る特許を維持する。 
理由 第1 手続の経緯
特許第6567205号の請求項1〜11に係る特許についての出願は、2018年(平成30年)6月14日を国際出願日として出願されたものであり、令和1年8月9日にその特許権の設定登録がされ、令和1年8月28日に特許掲載公報が発行された。本件特許異議の申立ての主な経緯は、次のとおりである。
令和 2年 2月27日 : 特許異議申立人藤江桂子(以下「特許異
議申立人」という。)による請求項1〜1
1に係る特許に対する特許異議の申立て
令和 2年 5月11日付け: 取消理由通知
令和 2年 6月24日 : 特許権者と審判合議体との面接
令和 2年 7月13日 : 特許権者による意見書及び訂正請求書の
提出
令和 2年 8月18日 : 特許異議申立人による意見書の提出
令和 3年 2月 4日付け: 訂正拒絶理由通知
令和 3年 2月25日付け: 特許権者と審判合議体との電子メール
及び電話での応対の記録
令和 3年 3月10日 : 特許権者による意見書及び手続補正書の
提出
令和 3年 5月26日付け: 取消理由通知(決定の予告)
令和 3年 7月 8日付け: 特許権者と審判合議体との電子メール
及び電話での応対の記録
令和 3年 7月29日 : 特許権者による意見書及び訂正請求書の
提出
令和 3年 9月 3日 : 特許異議申立人による意見書の提出
令和 4年 3月 9日付け: 取消理由通知(決定の予告)
令和 4年 4月28日付け: 特許権者と審判合議体との電子メール
及び電話での応対の記録
令和 4年 5月12日 : 特許権者による意見書及び訂正請求書の
提出
令和 4年 6月21日 : 特許異議申立人による意見書の提出

第2 訂正の適否
1 訂正請求書による訂正の内容
令和4年5月12日提出の訂正請求書により、特許権者は、特許請求の範囲の訂正を求めているところ、訂正事項は以下のとおりである。(下線部は、訂正により変更又は追加された箇所を示す。)
なお、令和2年7月13日に提出され、令和3年3月10日に補正された訂正請求書による訂正の請求及び令和3年7月29日に提出された訂正請求書による訂正の請求は、取り下げられたものとみなす。

(1)訂正事項1
特許請求の範囲の請求項1における「前記モータ駆動装置の駆動データおよび前記補正機能の種類に基づいて計算された特徴量と、」との記載を、「前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、」に訂正する。(請求項1の記載を引用する請求項2〜10も同様に訂正する。)

(2)訂正事項2
特許請求の範囲の請求項1における「前記状態変数に基づいて作成される訓練データセットに従って、前記補正パラメータを前記補正機能毎に学習する学習部と、」との記載を、「前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する学習部と、」に訂正する。(請求項1の記載を引用する請求項2〜10も同様に訂正する。)

(3)訂正事項3
願書に添付した明細書の段落【0007】に記載された「複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置であって、モータ駆動装置の駆動データおよび補正機能の種類に基づいて計算された特徴量と、補正パラメータとを状態変数として観測する状態観測部と、状態変数に基づいて作成される訓練データセットに従って、補正パラメータを補正機能毎に学習する学習部と、を備えることを特徴とする。」を「複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置であって、補正機能の種類に基づいて、モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、補正パラメータとを状態変数として観測する状態観測部と、状態変数に基づいて補正機能毎に作成される訓練データセットに従って、訓練データセットに含まれる状態変数を用いて補正パラメータを補正機能毎に学習する学習部と、を備えることを特徴とする。」に訂正する。

(4)訂正事項4
特許請求の範囲の請求項11における「前記モータ駆動装置の駆動データおよび前記補正機能の種類に基づいて計算された特徴量と、」との記載を、訂正事項1と同様に、「前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、」に訂正する。

(5)訂正事項5
特許請求の範囲の請求項11における「前記状態変数に基づいて作成される訓練データセットに従って、前記補正パラメータを前記補正機能毎に学習するステップと、」との記載を、訂正事項2と同様に、「前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習するステップと、」に訂正する。

2 訂正の対象となる請求項(一群の請求項)
本件訂正のうち、訂正事項1及び2に係る訂正は、請求項1についての訂正であり、訂正事項3に係る訂正は、明細書の記載について、訂正後の請求項1の記載に整合させる訂正であるところ、請求項2〜10は請求項1を引用する請求項であるから、訂正事項1〜3に係る訂正は、一群の請求項〔1〜10〕に対して請求されたものである。
また、本件訂正のうち、訂正事項4及び5に係る訂正は、請求項11に対して請求されたものである。

3 本件訂正の目的の適否、新規事項の有無、特許請求の範囲の拡張・変更の存否
(1)訂正事項1、2について
ア 訂正の目的
訂正事項1は、特許請求の範囲の請求項1について、訂正前の「特徴量」が、「前記モータ駆動装置の駆動データおよび前記補正機能の種類に基づいて計算された」ものとされていたのを、「補正機能の種類に基づいて」、「モータ駆動装置の駆動データから」、「計算により切り取られ抽出」されるものであること、すなわち、特徴量を特定するために必要な計算の内容を限定することで特許請求の範囲を減縮しようとするものであるから、この訂正の目的は、特許法第120条の5第2項ただし書第1号の特許請求の範囲の減縮を目的とするものに該当する。
訂正事項2は、特許請求の範囲の請求項1について、訂正前の「学習部」が、「前記状態変数に基づいて作成される訓練データセットに従って、前記補正パラメータを前記補正機能毎に学習する」ものとされていたのを、前記状態変数に基づいて「前記補正機能毎に」作成される訓練データセットに従って、「前記訓練データセットに含まれる前記状態変数を用いて」前記補正パラメータを前記補正機能毎に学習するもの、すなわち、学習に用いる訓練データセットが補正機能毎に作成されるものであること、学習が訓練データセットに含まれる状態変数を用いて行われること(訓練データセットには状態変数が含まれ、当該状態変数を用いて学習すること)を限定することで特許請求の範囲を減縮しようとするものであるから、この訂正の目的は、特許法第120条の5第2項ただし書第1号の特許請求の範囲の減縮を目的とするものに該当する。

イ 新規事項、特許請求の範囲の拡張・変更の存否
訂正事項1、2に関し、願書に添付した明細書(以下「本件特許明細書」という。)の段落【0017】には、「アルゴリズム選択部61は、補正機能情報から調整対象となる補正機能を示す情報を取得し、補正機能ごとに学習用駆動データDeから特徴量を抽出するために使用するアルゴリズムを選択する。・・・アルゴリズム記憶部62には、ローパスフィルタ、ハイパスフィルタ、バンドパスフィルタ、バンドエリミネイトフィルタなどの各種フィルタ、運動方向反転位置検出、速度ゼロ近傍検出、コーナ部検出などの運動特徴波形抽出、データ切り取り処理などを実行するための計算アルゴリズムを示す関数群が格納されている。データの切り取りは、データを切り取って切り取った部分を抽出することを指す。特徴量計算部63は、アルゴリズム選択部61から入力される計算アルゴリズム選択指令に基づいて、使用する計算アルゴリズムをアルゴリズム記憶部62から取出して、取出した計算アルゴリズムを用いて、学習用駆動データDeから補正機能ごとに特徴量を計算する。」との記載があり、段落【0018】には、「摩擦補正機能については、アルゴリズム選択部61は、運動方向反転位置検出、運動方向反転時近傍のデータ切り取りを選択する。学習用駆動データDeに、位置指令、位置フィードバック、モータ電流、理想的な位置に対する実際の位置のデータが含まれている場合、特徴量計算部63は、それぞれのデータに関して、選択された計算アルゴリズムを適用して特徴量を算出する。また、振動補正機能については、アルゴリズム選択部61は、運動停止直後のデータの切り取り、バンドパスフィルタを選択する。」との記載があるところ、データ切り取り処理は計算アルゴリズムによりなされるもの、すなわち、データ切り取りは計算によるものであり、したがって、上記段落【0017】、【0018】の記載から、特徴量が、補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出されるものであることが理解できる。
また、本件特許明細書の段落【0019】には、「機械学習装置100は、補正機能選択部12から入力される補正機能情報および補正パラメータ情報と、特徴量抽出部14から入力される特徴量Fvとに基づいて、補正パラメータを特徴量Fvごとに学習する。」、段落【0020】には、「状態観測部101は、補正パラメータ情報および特徴量を用いて、補正パラメータと、補正機能に基づいて抽出された特徴量とを状態変数として観測する。状態観測部101は、状態変数に基づいて、補正機能毎に訓練データセットを作成して出力する。学習部102は、状態観測部101が状態変数に基づいて作成した訓練データセットを用いて、特徴量毎に、つまり、補正機能毎に補正パラメータの学習を行い、学習結果Frを出力する。」と記載されるところ、この記載から、訓練データセットは補正機能毎に作成されるものであり、当該訓練データセットは状態変数に基づいて作成されるものであるから状態変数が含まれること、状態変数が含まれる訓練データセットを用いて学習が行われること(状態変数を用いて学習がなされること)が理解できる。
そうすると、「前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する」ことは本件特許明細書に記載された事項又は当該記載された事項から当業者にとって自明な事項である。
よって、訂正事項1、2に係る訂正は、本件特許明細書に記載された事項の範囲内で行われるものであるから新規事項に該当しない。
また、訂正事項1、2に係る訂正は、特許請求の範囲の減縮をするものであり、実質上特許請求の範囲を拡張し、又は変更するものに該当しないことは明らかであるから、特許法第120条の5第9項において準用する同法第126条第5項、第6項の規定に適合する。

(2)訂正事項3について
ア 訂正の目的
訂正事項3に係る訂正は、上記訂正事項1、2により請求項1が訂正されることに伴い、本件特許明細書の段落【0007】の記載を請求項1の記載と整合させるために行われるものであるから、許法第120条の5第2項ただし書第3号の明瞭でない記載の釈明を目的とする。

イ 新規事項、特許請求の範囲の拡張・変更の存否
訂正事項3に係る訂正が新規事項及び特許請求の範囲の拡張又は変更に当たらないことは上記(1)イについて記載したと同様であるから、特許法第120条の5第9項において準用する同法第126条第5項、第6項の規定に適合する。

(3)訂正事項4、5について
ア 訂正の目的
訂正事項4は、特許請求の範囲の請求項11について、訂正前の「特徴量」が、「前記モータ駆動装置の駆動データおよび前記補正機能の種類に基づいて計算された」ものとされていたのを、「補正機能の種類に基づいて」、「モータ駆動装置の駆動データから」、「計算により切り取られ抽出」されるものであること、すなわち、訂正事項1と同様に、特徴量を特定するために必要な計算の内容を限定することで特許請求の範囲を減縮しようとするものであるから、この訂正の目的は、特許法第120条の5第2項ただし書第1号の特許請求の範囲の減縮を目的とするものに該当する。
訂正事項5は、特許請求の範囲の請求項11について、訂正前の「学習部」が、「前記状態変数に基づいて作成される訓練データセットに従って、前記補正パラメータを前記補正機能毎に学習する」ものとされていたのを、前記状態変数に基づいて「前記補正機能毎に」作成される訓練データセットに従って、「前記訓練データセットに含まれる前記状態変数を用いて」前記補正パラメータを前記補正機能毎に学習するもの、すなわち、訂正事項2と同様に、学習に用いる訓練データセットが補正機能毎に作成されるものであること、学習が訓練データセットに含まれる状態変数を用いて行われること(訓練データセットには状態変数が含まれ、当該状態変数を用いて学習すること)を限定することで特許請求の範囲を減縮しようとするものであるから、この訂正の目的は、特許法第120条の5第2項ただし書第1号の特許請求の範囲の減縮を目的とするものに該当する。

イ 新規事項、特許請求の範囲の拡張・変更の存否
訂正事項4、5に係る訂正が新規事項及び特許請求の範囲の拡張又は変更に当たらないことは上記(1)イについて記載したと同様であるから、特許法第120条の5第9項において準用する同法第126条第5項、第6項の規定に適合する。

4 むすび
訂正事項1〜5に係る訂正は、特許法第120条の5第2項ただし書第1号又は第3号に掲げる事項を目的とするものであり、かつ、同条第9項で準用する同法第126条第5項及び第6項の規定に適合する。
したがって、明細書及び特許請求の範囲を、訂正請求書に添付された訂正明細書及び訂正特許請求の範囲のとおり、訂正後の請求項〔1〜10〕、11について訂正することを認める。

第3 本件発明
上記第2のとおり、本件訂正は認められるから、本件の請求項1〜11に係る発明(以下「本件発明1」等という。また、訂正後の明細書を「本件明細書」という。)は、次の事項により特定されるものである。
「【請求項1】
複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置であって、
前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、前記補正パラメータとを状態変数として観測する状態観測部と、
前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する学習部と、
を備えることを特徴とする機械学習装置。
【請求項2】
前記駆動データは、前記モータ駆動装置を駆動するモータからのフィードバックデータ、および、前記モータの制御対象である機械装置の駆動データのうち少なくとも1つを含むことを特徴とする請求項1に記載の機械学習装置。
【請求項3】
前記特徴量は、複数次元のベクトル量であり、前記補正機能毎の前記駆動データの特性を示すデータであることを特徴とする請求項1または2に記載の機械学習装置。
【請求項4】
前記学習部は、
前記状態変数に基づいて報酬を計算する報酬計算部と、
前記報酬に基づいて、前記補正パラメータを決定するための関数を更新する関数更新部と、
を有することを特徴とする請求項1から3のいずれか1項に記載の機械学習装置。
【請求項5】
前記関数更新部は、前記補正機能毎に前記関数を更新することを特徴とする請求項4に記載の機械学習装置。
【請求項6】
請求項1から5のいずれか1項に記載の機械学習装置と、
前記複数の種類の補正機能のうちの1つを選択する補正機能選択部と、
前記駆動データを取得する駆動データ取得部と、
選択された前記補正機能と、取得された前記駆動データとに基づき、前記特徴量を抽出する特徴量抽出部と、
前記補正パラメータの調整要件を入力する調整要件入力部と、
前記学習部の学習結果に基づいて、前記調整要件を満たす前記補正パラメータを決定する補正パラメータ決定部と、
を備えることを特徴とする補正パラメータ調整装置。
【請求項7】
前記駆動データは、前記モータ駆動装置を駆動するモータからのフィードバックデータ、および、前記モータの制御対象である機械装置の駆動データのうち少なくとも1つを含むことを特徴とする請求項6に記載の補正パラメータ調整装置。
【請求項8】
前記機械装置の駆動データは、前記機械装置に設置したセンサから取得した検出データであることを特徴とする請求項7に記載の補正パラメータ調整装置。
【請求項9】
前記補正パラメータ決定部は、
前記学習結果に基づいて補正パラメータを計算し、計算した前記補正パラメータを前記モータ駆動装置に送信する補正パラメータ計算部と、
計算した前記補正パラメータによる駆動結果が前記調整要件を満たすか否かを評価する補正パラメータ評価部と、
前記補正パラメータ評価部の評価結果に基づいて、前記補正パラメータの調整を終了するか否かを判定する終了判定部と、
を備えることを特徴とする請求項6から8のいずれか1項に記載の補正パラメータ調整装置。
【請求項10】
前記補正パラメータ評価部は、実際に前記モータ駆動装置を駆動したときに取得される駆動データ、および、前記モータ駆動装置の動きをシミュレーションしたときに取得される駆動データの少なくとも1つを用いて評価を行うことを特徴とする請求項9に記載の補正パラメータ調整装置。
【請求項11】
複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習方法であって、
機械学習装置が、前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、前記補正パラメータとを状態変数として観測するステップと、
前記機械学習装置が、前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習するステップと、
を含むことを特徴とする機械学習方法。」

第4 当審が令和4年3月9日付け取消理由通知(決定の予告)で通知した取消理由について
1 取消理由の概要
令和4年3月9日付けで、当審において令和3年7月29日付け訂正請求書により訂正された請求項1〜11に対し通知した取消理由通知(決定の予告)の理由(以下「取消理由」という。)の概要は以下のとおりである。
請求項1〜11に係る発明は、本件特許出願の日前の特許出願であって、本件特許出願後に出願公開がされた甲第7号証の特許出願の願書に最初に添付した明細書、特許請求の範囲又は図面に記載された発明と同一であり、しかも、本件特許出願の発明者が甲第7号証の特許出願に係る上記の発明をした者と同一ではなく、また本件特許出願の時において、その出願人が甲第7号証の特許出願の出願人と同一でもないから、請求項1〜11に係る特許は、特許法第29条の2(拡大先願)の規定に違反してされたものである。

・証拠
甲第7号証:特願2018−77686号(特開2019−185539号)

2 取消理由の判断
上記第2のとおり、本件訂正は認められるところ、訂正後の請求項に係る発明を基に取消理由(上記1)について検討する。

(1)甲第7号証の記載事項等
甲第7号証(以下「甲7」という。)の特許出願は、本件特許の出願日(国際出願日)よりも前の平成30年4月13日に出願され、本件特許の出願日よりも後の令和1年10月24日に出願公開がされたものであり、本件特許とは発明者及び出願人が異なるところ、甲7の特許出願の願書に最初に添付した明細書には、以下の事項が記載されている(下線は当審で付与した。)。
ア 「【0001】
本発明は、少なくとも2軸以上を駆動するモータを制御する制御装置と制御装置に対して機械学習を行う機械学習装置とを制御する調整装置及びその調整方法に関する。」

イ 「【0005】
本発明は・・・予め設定される特徴的な加工要素に対応する学習要素毎に学習する機械学習部を備える機械学習装置に対して、複数の特徴的な加工要素を含むワークを加工するための1つの評価用プログラムを動作させて学習する場合に、学習動作の間に、学習要素に応じて対応する機械学習部に基づいて学習することができるように、機械学習部を切り替えて学習するように制御する調整装置及びその調整方法を提供することを目的とする。」

ウ 「【0024】
以下、本発明の実施形態について図面を用いて詳細に説明する。
(第1の実施形態)
図1は本発明の第1の実施形態の調整システムを示すブロック図である。調整システム10は、図1に示すように、CNC(Computerized Numerical Control)装置100、機械学習装置200、及び調整装置300を備える。ここで、CNC装置100と機械学習装置200とは1対1の組とされて、調整装置300を介して通信可能に接続されている。より具体的には、調整装置300とCNC装置100、及び調整装置300と機械学習装置200とは、それぞれ接続インターフェースを介して直接に接続、又はそれぞれネットワークを介して接続されており、相互に通信を行うことが可能である。・・・」

エ 「【0026】
図3に示すように、位置P1で、テーブルをX軸方向に移動するサーボモータは、停止から回転動作に移り、テーブルはY軸方向の直線動作から円弧動作に移る。位置P2で、テーブルをY軸方向に移動するサーボモータは、回転から停止に移り、テーブルは円弧動作からX軸方向の直線動作に移る。
【0027】
また、図3に示すように、位置Q1で、テーブルをX軸方向に移動するサーボモータは回転方向が反転し、テーブルはX軸方向に直線反転するように移動する。
【0028】
すなわち、図3に示す加工ワークは、P1〜P2を含む加工要素(以下、「線形的に回転速度が変更される加工要素」、「第1の加工要素」ともいう)と、Q1を含む加工要素(以下、「非線形的に回転速度が変更される加工要素」、「第2の加工要素」ともいう)との、種類の異なる2つの加工要素を含む。
【0029】
本実施形態においては、位置P1及び位置P2を含む加工要素(第1の加工要素)により、線形的に回転速度が変更されたときの速度指令の最適な補正を行うための第1の学習を行うと共に、位置Q1を含む加工要素(第2の加工要素)により、回転方向が反転する場合に惰走(いわゆる「象限突起」)が発生するときの(象限突起を抑制するための)速度指令の最適な補正を行うための第2の学習を行うものとする。
このため、本実施形態においては、機械学習装置が、各々の加工要素に対応する機械学習部を備え、CNC装置が、各々の加工要素に対する補正部を備えると共に、各補正部が、自身に対応する機械学習部の学習により生成された制御パラメータを用いて速度指令に対する補正を行う。これら学習の詳細については、後述する。
・・・
【0031】
<CNC装置100>
図2はCNC装置の一構成例を示すブロック図である。説明の便宜上、図2において、調整装置300及び機械学習装置200も示している。ここで、CNC装置100は、サーボ制御部を含むものを例示しているが、これに限られない。サーボ制御部を別装置としてもよい。
【0032】
図2に示すように、CNC装置100は、制御対象500のサーボモータ600を制御する。サーボモータ600は、制御される軸が少なくとも2軸以上ある場合は軸の数分設けられる。本実施形態では評価用プログラムが少なくとも2軸動作させるので、サーボモータの数は少なくとも2つ設けられる。ここではモータとしてサーボモータを示しているが、スピンドルモータ等の他のモータを用いてもよい。制御対象500は例えばサーボモータ、サーボモータを含む工作機械,ロボット,産業機械等である。CNC装置100は工作機械、ロボット、又は産業機械等の一部として設けられてもよい。以下、制御対象500がサーボモータを含む工作機械である場合を例にとって説明する。
【0033】
図2に示すように、CNC装置100は、数値制御情報処理部1011、記憶部1012、減算器1013、位置制御部1014、加算器1015、減算器1016、速度制御部1017、加算器1018、積分器1019、第1補正部1031_1及び第2補正部1031_2を備えている。数値制御情報処理部1011と記憶部1012を除くCNC装置100の各構成部はサーボモータ毎に設けられる。第1補正部1031_1は、線形的に回転速度が変更される加工要素(第1の加工要素)に対応し、第2補正部1031_2は、非線形的に回転速度が変更される加工要素(第2の加工要素)に対応する。
・・・
【0035】
数値制御情報処理部1011は、後述の調整装置300からの実行指示に基づいて、記憶部1012から評価用プログラムを読み出して、評価用プログラムを実行する。そうすることで、数値制御情報処理部1011は、当該評価用プログラム中に含まれるコードに基づいて位置指令値を作成し、減算器1013に出力する。数値制御情報処理部1011は、評価用プログラムにより指定される加工形状となるように、送り速度を設定して位置指令値を作成する。
【0036】
減算器1013は数値制御情報処理部1011から位置指令値を受け、位置指令値と位置フィードバックされた検出位置との差を求め、位置偏差として位置制御部1014に出力すると共に後述の調整装置300に対して送信する。」

オ 「【0038】
第1補正部1031_1は、例えば数式1(以下に数1として示す)で示す伝達関数Gf(s)で示される補正量計算処理を行い、算出した補正量(以下「第1の補正量」ともいう)を加算器1015に出力する。第1補正部1031_1は、第1の加工要素に対応する補正部である。したがって、第1補正部1031_1は、第1の加工要素に係る加工時に補正量を算出する。
【数1】


第1の実施形態では、伝達関数Gf(s)の次元を予め設定された値とした場合に、各係数a1i、b1j(0≦i,j≦n)を最適なものとするように機械学習する。以下、係数a1i、b1jをCNC装置100の制御パラメータともいう。
なお、第1補正部1031_1は、通常のCNC装置における位置フィードフォワード計算部に対応する。
【0039】
第2補正部1031_2は、例えば数式2(以下に数2として示す)で示す、係数のみ異なる同一の伝達関数Gf(s)で示される補正量計算処理を行い、算出した補正量(以下「第2の補正量」ともいう)を加算器2017に出力する。第2補正部1031_2は、第2の加工要素に対応する補正部である。したがって、第2補正部1031_2は、第2の加工要素に係る加工時に補正量を算出する。
【数2】


【0040】
第1補正部1031_1で用いる伝達関数Gf(s)の係数と同様に、伝達関数Gf(s)の次元を予め設定された値とした場合に、各係数a2i、b2j(0≦i,j≦n)を最適なものとするように機械学習する。以下、係数a2i、b2jもCNC装置100の制御パラメータともいう。
なお、第2補正部1031_2は、通常のCNC装置におけるバックラッシ補正部に対応する。
【0041】
加算器1015は、速度指令値と第1補正部1031_1又は第2補正部1031_2の出力値とを加算して、補正された速度指令値として減算器1016に出力する。減算器1016は加算器1015の出力と速度フィードバックされた速度検出値との差を求め、その差を速度偏差として速度制御部1017に出力する。
【0042】
速度制御部1017は、速度偏差に積分ゲインK1vを乗じて積分した値と、速度偏差に比例ゲインK2vを乗じた値とを加算して、トルク指令値としてサーボモータ600に出力する。
【0043】
制御対象500のサーボモータ600の回転角度位置は、サーボモータ600に関連付けられた、位置検出部となるロータリーエンコーダによって検出され、検出された信号は速度フィードバックされる速度検出値として利用される。速度検出値は積分器1019で積分され、位置フィードバックされる位置検出値として利用される。
以上のように、CNC装置100は構成される。
【0044】
<機械学習装置200>
次に、第1実施形態における機械学習装置200について説明する。前述したとおり、機械学習装置200は、2つの機械学習部210_1及び210_2を備え、機械学習部210_1は、[数1]で示す第1補正部1031_1における伝達関数に係る制御パラメータa1i、b1i(0≦i≦n)を強化学習する。また、機械学習部210_2は、[数2]で示す第2補正部1031_2における伝達関数に係る制御パラメータa2j、b2j(0≦j≦n)を強化学習する。すなわち、機械学習部210_1は、CNC装置100が備える第1補正部1031_1に対応し、機械学習部210_2は、第2補正部1031_2に対応する。
【0045】
機械学習部210_1は、[数1]で示す第1補正部1031_1における伝達関数に係る制御パラメータa1i、b1iの値、並びに評価用プログラムを実行することで取得されるCNC装置100の位置偏差情報を含む、指令及びフィードバック等のサーボ状態を状態Sとして、当該状態Sに係る制御パラメータa1i、b1iの調整を行動Aとする、Q学習(Q−learning)を行う。同様に、機械学習部210_2は、[数2]で示す第2補正部1031_2における伝達関数に係る制御パラメータa2j、b2jの値、並びに評価用プログラムを実行することで取得されるCNC装置100の位置偏差情報を含む、指令及びフィードバック等のサーボ状態を状態Sとして、当該状態Sに係る制御パラメータa2j、b2jの調整を行動Aとする、Q学習(Q−learning)を行う。当業者にとって周知のように、Q学習では、或る状態Sのとき、取り得る行動Aのなかから、価値Q(S,A)の最も高い行動Aを最適な行動として選択することを目的とする。
【0046】
具体的には、エージェント(機械学習装置)は、或る状態Sの下で様々な行動Aを選択し、その時の行動Aに対して、与えられる報酬に基づいて、より良い行動の選択をすることにより、正しい価値Q(S,A)を学習していく。」

カ 「【0050】
機械学習部210_1は、[数1]で示す第1補正部1031_1における伝達関数に係る制御パラメータa1i、b1jに基づいて、予め設定された評価用プログラムを実行することで得られるCNC装置100の位置偏差情報を含む、指令及びフィードバック等のサーボ状態を含む状態情報Sを観測して、行動Aを決定する。状態情報はフィードバック情報に対応する。機械学習部210_1は、行動Aをするたびに報酬rが返ってくる。
ここで、報酬rを次のように設定する。
行動情報Aにより状態情報Sが状態情報S´に修正された場合、状態情報S´に係る修正後の制御パラメータa1i、b1jに基づいて動作したCNC装置100の位置偏差の集合から所定の評価関数に基づいて算出される値が、行動情報Aにより修正される前の状態情報Sに係る修正前の制御パラメータa1i、b1jに基づいて動作したCNC装置100の位置偏差の集合から所定の評価関数に基づいて算出される値よりも大きくなった場合に、報酬の値を負の値とする。
【0051】
他方、行動情報Aにより修正された状態情報S´に係る修正後の制御パラメータa1i、b1jに基づいて動作したCNC装置100の位置偏差の集合から所定の評価関数に基づいて算出される値が、行動情報Aにより修正される前の状態情報Sに係る修正前の制御パラメータa1i、b1jに基づいて動作したCNC装置100の位置偏差の集合から所定の評価関数に基づいて算出される値よりも小さくなった場合に、報酬の値を正の値とする。
ここで、位置偏差の値の集合とは、前述した加工形状の位置P1と位置P2を含む所定の範囲内で計測される位置偏差の集合を意味する。また、評価関数としては、例えば、位置偏差の絶対値の積算値を算出する関数、位置偏差の絶対値に時間の重み付けをして積算値を算出する関数、位置偏差の絶対値の2n(nは自然数)乗の積算値を算出する関数、位置偏差の絶対値の最大値を算出する関数等が例示されるが、これに限られるものではない。
Q学習では、機械学習部210_1は、例えば、将来にわたっての報酬rの合計が最大になる最適な行動Aを試行錯誤的に探索する。そうすることで、機械学習部210_1は、第1補正部1031_1における伝達関数に係る制御パラメータa1i、b1jに基づいて、予め設定された評価用プログラムを実行することで取得されるCNC装置100の位置偏差情報を含む指令、フィードバック等のサーボ状態を含む状態Sに対して、最適な行動A(すなわち、最適な制御パラメータa1i、b1j)を選択することが可能となる。
なお、機械学習部210_2については、位置偏差の値の集合を、前述した加工形状の位置Q1を含む所定の範囲内で計測される位置偏差の集合として、読み替えることで説明されるので、詳細な説明は省略する。
【0052】
図4は本発明の第1の実施形態の機械学習部210_1又は機械学習部210_2に共通の機能ブロックを示すブロック図である。機械学習部210_1及び機械学習部210_2は、それぞれ状態情報取得部211_1、状態情報取得部211_2、学習部212_1、学習部212_2、行動情報出力部213_1、行動情報出力部213_2、価値関数記憶部214_1、価値関数記憶部214_2、及び最適化行動情報出力部215_1、最適化行動情報出力部215_2、を備える。また、学習部212_1、又は学習部212_2は、それぞれ報酬出力部2121_1、報酬出力部2121_2、価値関数更新部2122_1、価値関数更新部2122_2及び行動情報生成部2123_1、行動情報生成部2123_2を備える。
なお、説明の便宜上、機械学習部210_1又は機械学習部210_2を機械学習部210として説明する。同様に、状態情報取得部211_1、211_2、学習部212_1、212_2、行動情報出力部213_1、213_2、価値関数記憶部214_1、214_2、及び最適化行動情報出力部215_1、215_2、報酬出力部2121_1、2121_2、価値関数更新部2122_1、2122_2及び行動情報生成部2123_1、2123_2をそれぞれ、状態情報取得部211、学習部212、行動情報出力部213、価値関数記憶部214、最適化行動情報出力部215、報酬出力部2121、価値関数更新部2122、及び行動情報生成部2123と略する。
上述した強化学習を行うために、図4に示すように、機械学習部210は、状態情報取得部211、学習部212、行動情報出力部213、価値関数記憶部214、及び最適化行動情報出力部215を備える。学習部212は報酬出力部2121、価値関数更新部2122、及び行動情報生成部2123を備える。
【0053】
状態情報取得部211は、前述したように、CNC装置100における第1補正部1031_1における伝達関数に係る制御パラメータa1i、b1j又は第2補正部1031_2における伝達関数に係る制御パラメータa2i、b2jに基づいて、予め設定された評価用プログラムを実行することで取得されるCNC装置100の位置偏差情報を含む指令、フィードバック等のサーボ状態を含む、フィードバック情報となる状態情報Sを、後述の調整装置300を介してCNC装置100から取得する。この状態情報Sは、Q学習における、環境状態Sに相当する。
状態情報取得部211は、取得した状態情報Sを学習部212に対して出力する。
なお、最初にQ学習を開始する時点での第1補正部1031_1における伝達関数に係る制御パラメータa1i、b1j又は第2補正部1031_2における伝達関数に係る制御パラメータa2i、b2jは、予めユーザの指定により後述の調整装置300が生成する。本実施形態では、後述の調整装置300が作成した第1補正部1031_1における伝達関数に係る制御パラメータa1i、b1j又は第2補正部1031_2における伝達関数に係る制御パラメータa2i、b2jの初期設定値を、強化学習により最適なものに調整する。制御パラメータa1i、b1j又は制御パラメータa2i、b2jは例えば、初期設定値として、a1,0=a2,0=1、a1,1=a2,1=0、b1,0=b2,0=0、b1,1=b2,1=制御対象のイナーシャ値としてもよい。また、係数a1i、b1j又はa2i、b2jの次元m、nを予め設定してもよい。
例えば、a1i及びa2iについては0≦i≦m b1j及びb2jについては0≦j≦nとする。
【0054】
学習部212は、或る環境状態Sの下で、ある行動Aを選択する場合の価値Q(S,A)を学習する部分である。具体的には、学習部212は、報酬出力部2121、価値関数更新部2122及び行動情報生成部2123を備える。
【0055】
報酬出力部2121は、或る状態Sの下で、行動Aを選択した場合の報酬rを前述したとおり、算出する。
【0056】
価値関数更新部2122は、状態Sと、行動Aと、行動Aを状態Sに適用した場合の状態S´と、上記のようにして算出された報酬の値rと、に基づいてQ学習を行うことにより、価値関数記憶部214が記憶する価値関数Qを更新する。
なお、価値関数Qの更新は、オンライン学習で行ってもよく、バッチ学習で行ってもよく、ミニバッチ学習で行ってもよい。オンライン学習、バッチ学習、ミニバッチ学習のいずれかの選択は調整装置300が行うことができる。
オンライン学習とは、或る行動Aを現在の状態Sに適用することにより、状態Sが新たな状態S´に遷移する都度、即座に価値関数Qの更新を行うという学習方法である。また、バッチ学習とは、或る行動Aを現在の状態Sに適用することにより、状態Sが新たな状態S´に遷移することを繰り返すことにより、学習用のデータを収集し、収集した全ての学習用データを用いて、価値関数Qの更新を行うという学習方法である。更に、ミニバッチ学習とは、オンライン学習と、バッチ学習の中間的な、ある程度学習用データが溜まるたびに価値関数Qの更新を行うという学習方法である。」

キ 「【0063】
<調整装置300>
次に、第1の実施形態における調整装置300について説明する。
図5A及び図5Bは調整装置300の一構成例を示すブロック図である。調整装置300は、フィードバック情報送信部301、パラメータ設定情報取得部302、パラメータ修正情報取得部303、起動指示出力部304、評価用プログラム記憶部305、評価用プログラム出力部306、評価用プログラム実行指示出力部307、フィードバック情報取得部308、パラメータ設定情報送信部309、パラメータ修正情報送信部310、パラメータ初期設定送信部311、及び制御部312を備えている。更に、制御部312は、学習制御部3121と判定部3122とを備える。」

ク 「【0073】
調整装置300からの実行指示を受けた後、CNC装置100の数値制御情報処理部1011は、ステップS63において、記憶部1012から評価用プログラムを読み出し、評価用プログラムに基づき位置指令値を作成する。CNC装置100はサーボモータ600を制御し、ステップS64において、第1補正部1031_1の伝達関数の各係数a1i、b1jの値、第2補正部1031_2の伝達関数の各係数a2i、b2jの値、並びに評価用プログラムを実行することで取得されるCNC装置100の位置偏差情報を含むフィードバック情報を、該フィードバック情報が由来する評価用加工プログラムの動作中の加工位置情報又は評価用プログラムのブロック番号と共に、調整装置300に送信する。このフィードバック情報は状態情報Sとなる。
【0074】
調整装置300の制御部312は、ステップS45で、フィードバック情報をブロック番号と共にフィードバック情報取得部308を介して取得し、フィードバック情報送信部301を介して、評価用加工プログラムの動作中の加工位置情報又は評価用プログラムのブロック番号に対応する機械学習部210_1又は210_2に送信する。機械学習部210_1又は210_2はステップS32でフィードバック情報を受信する。
・・・
【0076】
調整装置300の制御部312は、評価用プログラムによる一連の加工の終了通知を受けると、評価用プログラムの終了通知を受けた回数を記録、更新する。そして、調整装置300の制御部312は、ステップS46において、その回数が所定の回数を超えたか、或いは所定の学習期間を過ぎたかを判断し、機械学習を終了させるか否かの判断を行う。機械学習を終了させない場合には(ステップS46のNO)、ステップS47に移行する。機械学習を終了させる場合には(ステップS46のYES)、ステップS49に移行する。
調整装置300は、ステップS47において、機械学習装置200の機械学習部210_1又は210_2に対して、報酬計算、価値関数更新を指示する。
【0077】
機械学習装置200の機械学習部210_1又は210_2は、ステップS33で報酬計算、価値関数更新の指示を受信すると、ステップS34において、CNC装置100から受信した制御パラメータ、すなわち、自身に対応する第1補正部1031_1の伝達関数の各係数a1i、b1jの値(制御パラメータの値)又は第2補正部1031_2の伝達関数の各係数a2i、b2jの値(制御パラメータの値)が初期設定値であるか否かを判断する。言い換えると、制御パラメータが初期設定値(状態情報)S0の集合であるか、制御パラメータが初期設定値(状態情報)S0以降の状態情報Sの集合であるかを判断する。・・・」

ケ 「【0084】
機械学習装置200の機械学習部210_1又は210_2(最適化行動情報出力部215)は、ステップS38において、価値関数記憶部204に記憶している価値関数Qを取得し、取得した価値関数Qに基づいて、例えば、初期状態S0に対して最適化行動情報となる制御パラメータ設定情報を生成し、生成した制御パラメータ設定情報を調整装置300に対して出力する。
【0085】
調整装置300は、ステップS50において、制御パラメータ設定情報を、送信元が機械学習部210_1又は210_2のいずれであるかを示す情報と共に取得すると、CNC装置100の、制御パラメータ設定情報の送信元に対応する第1補正部1031_1又は第2補正部1031_2に対して出力する。
【0086】
CNC装置100は、ステップS67において、調整装置300から受信した制御パラメータ設定情報に基づいて、制御パラメータ設定情報の送信元に対応する第1補正部1031_1における伝達関数に係る係数a1i、b1j、及び第2補正部1031_2における伝達関数に係る係数a2i、b2jを最適な値に設定する。」

上記記載事項から以下の事項が理解できる。
コ 上記ア〜エ、ケより、モータを制御する制御装置(CNC装置)に対して機械学習を行うものであり、線形的に回転速度が変更される位置P1及びP2を含む加工要素である第1加工要素と、非線形的に回転速度が変更される位置Q1を含む加工要素である第2加工要素との種類の異なる2つの加工要素について、線形的に回転速度が変更されたときの速度指令の最適な補正を行うための第1の学習、回転方向が反転する場合に惰走が発生するときの速度指令の最適な補正を行うための第2の学習をそれぞれ行うものであること。

サ 上記オ〜カから、第1の学習、第2の学習は、状態Sの下で得られる報酬に基づくQ学習により、伝達関数の制御パラメータ(係数)が最適なものとなるよう、2つの機械学習部でなされるものであり、補正量は第1補正部、第2補正部で算出されること。また、状態情報は、状態情報取得部211で取得されるものであること。また、評価関数には位置偏差の値の集合が入力されるものであること(段落【0051】)。

シ 上記エ、クから、「調整装置300の制御部312は、・・・フィードバック情報をブロック番号と共にフィードバック情報取得部308を介して取得し、・・・評価用加工プログラムの動作中の加工位置情報又は評価用プログラムのブロック番号に対応する機械学習部210_1又は210_2に送信する」もの(段落【0074】)であるから、位置偏差情報を含むフィードバック情報(状態情報)を、第1の学習、第2の学習のために、それぞれ加工位置情報又は評価用プログラムのブロック番号に対応付けて抽出していること。また、調整装置に送信される位置偏差は、位置指令値と位置フィードバックされた検出位置との差として減算器1013により求められること(段落【0036】)。

ス 上記カ、クから、「フィードバック情報」は、CNC装置100の位置偏差情報を含む指令、フィードバック、制御パラメータ等のサーボ状態を含むものであり、「状態情報」と等価の意味で用いられていること(段落【0053】、【0073】、【0077】)。

セ 上記キ〜クから、調整装置300の制御部312は、機械学習の回数が所定の回数を超えたか、或いは所定の学習期間を過ぎたかを判断し、機械学習を終了させるか否かの判断を行うこと(段落【0076】)。

(2)甲7発明
上記(1)から、甲7には以下の発明(以下「甲7発明」という。)が開示されていると認められる。
線形的に回転速度が変更される位置P1及びP2を含む加工要素である第1加工要素と、非線形的に回転速度が変更される位置Q1を含む加工要素である第2加工要素との種類の異なる2つの加工要素について、線形的に回転速度が変更されたときの速度指令の最適な補正、回転方向が反転する場合に惰走が発生するときの速度指令の最適な補正をそれぞれ行う、モータを制御する制御装置において、各加工要素についての速度指令の最適な補正を行うための制御パラメータの第1の学習、第2の学習を、第1の学習部、第2の学習部で行う機械学習装置であって、
状態情報取得部で得た位置偏差情報を含む指令、フィードバック、制御パラメータ等のサーボ状態を含むフィードバック情報の状態情報を、第1の学習、第2の学習のためにそれぞれ加工位置情報又は評価用プログラムのブロック番号に対応付けて抽出する調整装置の制御部を有し、位置偏差情報は位置指令値と位置フィードバックされた検出位置との差として求められるものであり、
前記状態情報に基づいて前記第1の学習、第2の学習のためにそれぞれ作成される位置偏差の値の集合を評価関数に入力することで、第1加工要素、第2加工要素のそれぞれの速度指令に対する補正をする制御パラメータを学習する2つの機械学習部と、
を備える機械学習装置。

(3)本件発明1について
本件発明1と甲7発明との対比、検討をする。
甲7発明における、種類の異なる2つの加工要素について、それぞれ最適な補正を行うことは、本件発明1において、複数の種類の補正機能を有することに相当するといえ、甲7発明の「モータを制御する制御装置」は、本件発明1の「モータ駆動装置」に相当する。
よって、甲7発明の「線形的に回転速度が変更される位置P1及びP2を含む加工要素である第1加工要素と、非線形的に回転速度が変更される位置Q1を含む加工要素である第2加工要素との種類の異なる2つの加工要素について、線形的に回転速度が変更されたときの速度指令の最適な補正、回転方向が反転する場合に惰走が発生するときの速度指令の最適な補正をそれぞれ行う、モータを制御する制御装置」は、本件発明1の「複数の種類の補正機能を有するモータ駆動装置」に相当する。
甲7発明における「各加工要素についての速度指令の最適な補正を行うための制御パラメータの第1の学習、第2の学習を、第1の学習部、第2の学習部で行う」ことは、本件発明1の「モータを制御するための指令値の補正に用いられる補正パラメータを学習する」ことに相当し、甲7発明の「機械学習装置」は、本件発明1の「機械学習装置」に相当する。
甲7発明の「状態情報取得部で得た位置偏差情報を含む指令、フィードバック、制御パラメータ等のサーボ状態を含むフィードバック情報の状態情報を、第1の学習、第2の学習のためにそれぞれ加工位置情報又は評価用プログラムのブロック番号に対応付けて抽出する調整装置の制御部」に関し、位置偏差(情報)を求める際に、位置指令値と位置フィードバックされた検出位置との差を求める減算(計算)の処理を含むものであり、第1学習、第2学習それぞれに用いる情報のみを抽出するものであるから、「抽出」により得られた「状態情報」は、本件発明1の「特徴量」に相当するといえる。また、甲7発明の「制御パラメータ」が本件発明1の「補正パラメータ」に相当することは明らかであるところ、甲7発明の「状態情報」は、特徴量に相当する情報と、補正パラメータに相当する制御パラメータを含むから、本件発明1の「状態変数」に相当する。
よって、甲7発明の「状態情報取得部で得た位置偏差情報を含む指令、フィードバック、制御パラメータ等のサーボ状態を含むフィードバック情報の状態情報を、第1の学習、第2の学習のためにそれぞれ加工位置情報又は評価用プログラムのブロック番号に対応付けて抽出する調整装置の制御部」は、本件発明1の「前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、前記補正パラメータとを状態変数として観測する状態観測部」と、「前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により抽出された特徴量と、前記補正パラメータとを状態変数として観測する状態観測部」という限りにおいて相当する。
甲7発明の「前記状態情報に基づいて前記第1の学習、第2の学習のためにそれぞれ作成される位置偏差の値の集合を評価関数に入力することで、第1加工要素、第2加工要素のそれぞれの速度指令に対する補正をする制御パラメータを学習する2つの機械学習部」に関し、学習のための評価関数に入力される「位置偏差の値の集合」は、位置偏差が状態情報に基づくものであることは明らかであるから、当該「位置偏差の値の集合」は、本件発明1の「前記状態変数に基づいて」「作成される訓練データセット」に相当し、甲7発明の「機械学習部」は、本件発明1の「学習部」に相当する。
よって、甲7発明の「前記状態情報に基づいて前記第1の学習、第2の学習のためにそれぞれ作成される位置偏差の値の集合を評価関数に入力することで、第1加工要素、第2加工要素のそれぞれの速度指令に対する補正をする制御パラメータを学習する2つの機械学習部」は、本件発明1の「前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する学習部」に相当する。

そうすると、本件発明1と甲7発明とは以下の一致点で一致し、相違点において相違する。

一致点:複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置であって、
前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により抽出された特徴量と、前記補正パラメータとを状態変数として観測する状態観測部と、
前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する学習部と、
を備える機械学習装置。

相違点:本件発明1の特徴量は、モータ駆動装置のデータから計算により切り取られ抽出されたものであるのに対し、甲7発明の状態情報(特徴量)は、それに含まれる位置偏差情報を、位置指令値と位置フィードバックされた検出位置との差として求めるものであって、計算により切り取られ抽出されたものではない点。

上記相違点について検討する。
甲7発明では、状態情報(特徴量)は、それに含まれる位置偏差情報を、位置指令値と位置フィードバックされた検出位置との差として求めるもの(甲7の【0036】)であるから、減算という計算の処理を含むものといえるが、状態情報(特徴量)を計算により切り取り抽出することについては、甲7の全体を見渡しても記載も示唆もない。
また、甲7発明において、状態情報(特徴量)を計算により切り取り抽出を行うことが自明のことともいえない。
そうすると、上記相違点は実質的な相違点であるから、本件発明1と甲7発明とは同一の発明ではなく、本件発明1に係る特許が、特許法第29条の2の規定に違反してなされたものとはいえない。

(4)本件発明2〜10について
上記(3)のとおり、本件発明1に係る特許が、特許法第29条の2の規定に違反してなされたものということはできないものであるところ、本件発明2〜10は、本件発明1の発明特定事項の全てを含むものであるから、上記本件発明1と甲7発明との相違点と同じ相違点を有するものである。
よって、本件発明2〜10に係る特許が、特許法第29条の2の規定に違反してなされたものとはいえない。

(5)本件発明11について
本件発明11は、機械学習方法の発明であるところ、甲7には甲7発明に対応する方法の発明も開示されているといえるが、本件発明11と当該甲7発明に対応する方法の発明を対比すると、上記本件発明1と甲7発明との相違点と同様の相違点を有するものと認められる。
そして、当該相違点が実質的な相違点であることは、上記(3)に示したとおりである。
よって、本件発明11に係る特許が、特許法第29条の2の規定に違反してなされたものとはいえない。

(6)小括
以上のとおり、本件発明1〜11に係る特許は、当審が令和4年3月9日付け取消理由通知(決定の予告)で通知した取消理由である特許法第29条の2(拡大先願)の規定に違反してなされたものとはいえない。

第5 その他の特許異議申立理由について
1 特許異議申立理由の概要
本件特許異議の申立てにおいて、特許異議申立人が主張した特許異議申立理由であり、令和4年3月9日付け取消理由通知(決定の予告)に採用しなかった理由の要旨は、次のとおりである。

(1)進歩性欠如
本件発明1〜11は、本件特許出願前に頒布された刊行物である甲第1号証に記載された発明及び周知技術1(甲第2号証)、周知技術2(甲第3号証〜甲第5号証)、周知技術3(甲第6号証)に基づいて、当業者が容易に発明することができたものであるから、本件発明1〜11に係る特許は、特許法第29条第2項の規定に違反してされたものである。

・証拠
甲第1号証:野田他、機械学習の枠組みに基づく能動型探索アルゴリズムのサーボパラメータ調整問題への適用性の検討、計測自動制御学会論文集、平成29(2017)年3月、第53巻、第3号、p.217〜228
甲第2号証:三菱電機株式会社、MITSUBISI CNC MDS−D2/DH2シリーズ取扱説明書、2014年6月発行、p.5−1〜5−70(5章 サーボ調整)
甲第3号証:特開2017−102624号公報
甲第4号証:特開2017−68563号公報
甲第5号証:特開2009−244933号公報
甲第6号証:特開2005−78477号公報

(2)記載要件違反
本件発明1〜11は明確でないから、本件発明1〜11に係る特許は、特許法第36条第6項第2号の規定に違反してされたものである。
また、本件明細書の発明の詳細な説明の記載は、当業者がその実施をすることができる程度に明確かつ十分に記載したものでないから、本件発明1、2、4、6〜11に係る特許は、特許法第36条第4項第1号に違反してされたものである。

2 特許異議申立理由の判断
(1) 進歩性欠如
ア 甲第1号証の記載事項等
甲第1号証(以下「甲1」という。)には、以下の事項が記載されている(下線は当審で付与した。)。
(ア)「1.はじめに
産業現場で用いられる制御システムには調整すべきパラメータが存在する。制御パラメータの調整コストを下げるためさまざまなオートチューニング手法が実用化されてきたが、モデル化が困難な制御対象に対して制御性能が厳しく要求される場合には、いわゆる熟練作業者が制御対象の応答を見ながら現物あわせで調整しているのが現状である。
このような調整作業はやってみるまで結果がわからない。作業者の熟練度などにより作業の結果と時間にムラが発生し、迅速かつ低コストなシステムインテグレーションを阻害する典型的な難題の1つと捉えられている。その困難さの本質は、未知の目的関数の最適化問題として定式化できるのである。
著者らは機械学習とりわけ能動学習のスキームに基づいて、未知の目的関数を最適化する独自の能動型探索アルゴリズムの開発を進めている。同アルゴリズムの提案、パーソナルコンピュータ程度のハードウェア上でソフトウェアとして実装可能であること、ある金属加工機の加工制御パラメータ開発期間を短縮する効果があることを既報した。問題の困難さの本質の解法であるからには同種の困難さを持つ問題への水平展開が可能と考えらえる。よって今後、さまざまな現場の要求を含めた事例への適用性を調べることが課題となる。
たとえば、産業メカトロニクス分野で用いられる位置決めサーボシステムのゲイン調整、すなわち制御パラメータの調整に関して、まさに冒頭で述べた課題が発生している。そこで本稿では本アルゴリズムがこの問題にも適用可能かを検討、同時に多目的最適化、誤差因子に対するロバスト化、計算時間の短縮化といった現場の要求を考慮しうるかを報告する。
第2章で能動型探索アルゴリズムを説明し、第3章でサーボパラメータのオートチューニング問題の背景について述べ、第4章で同アルゴリズムの適用性を検討する。」(217頁左欄1行〜右欄14行)

(イ)「3.サーボパラメータの自動調整について
サーボパラメータの自動調整は古くから取り組まれてきた課題であり、1980年代後半から定点観測的に動向調査が報告されている。それらの基本原理はさまざまであり、たとえば制御対象のモデルを同定して解析的にパラメータを決定する方法から、特定の特徴量に注目したもの、ヒューリスティックによるものまで、数多くの手法がある。市場に投入される商用の制御システム製品や制御システム設計のソフトウェアツール類についても自動調整機能は必須といえる状況であり、整定時間の短さが厳しく要求されるのに制御対象のメカの剛性が低くて移動速度で稼げないなどの特殊な場面でない限り、自動調整機能は便利に利用されている。
その一方で、前述の特殊な場面に遭遇した場合には、人手による調整が実施されており、その自動化が求められている。そこでは、現場ニーズを満たすため、制御対象にダメージを与える発振現象を避けながらの安全な調整、より高ゲインの追求、自動調整に要する時間の短縮、自動調整の適用可能範囲の拡大、などを目標として、企業間の競争領域として研究開発、製品化開発が続けられている。能動型探索アルゴリズムをサーボパラメータの自動調整問題に適用することは、上に述べたような人手で調整しないといけない特殊な場面を想定していることになる。
本研究ではそのような場面を、パラメータの変化に対する制御性能の変化を制約条件付きの目的関数をノンパラメットリックモデルで逐次構築しながら同時にパラメータの最適値を探索するという、未知の目的関数の最適化問題として捉えることにした。
なお、解法が確立した場面から外れているからこそ特殊となる場面であるから、その類例と適切な解法との対比はにわかには困難である。適用事例を積み重ねながらまずは傾向を分析していくことが必要で、その過程の中で提案するアルゴリズムが適用可能あるいは適用不適切な場面や条件を明確化していくことが重要であると考えている。もちろん同アルゴリズムがすべての場面でサーボパラメータの自動調整に適していないという結論が導かれることは厭わない。」(220頁左欄32行〜右欄18行)

(ウ)「4.調整に対する要求仕様を満たす実装の検討
前章で述べた能動型探索アルゴリズムが、位置決めサーボシステムの制御パラメータ調整に効を奏するかを確認するにあたり、市場で使用されている位置決めシステムの主要構成のみに抽象化した実験を行なうことにした。すなわち位置決めシステムの最小構成要素であるサーボコントローラ、モータ、ボールねじ、軸受け、リニアガイドほかの機構を組み合わせた実験装置を構築し、制御パラメータを与え、位置決め動作を実行し、動作状態を計測する系を組んだ。定性的な話になるが、実験装置のメカニカル要素の各部材は高剛性素材を使用せず、組み立て作業、据え付け作業についても微調整などに格別の注意を払わずにおいたため、ガタや動きの渋さが部分によって異なるなど、いくばくかの非線形性をはらんでいると考える。このような系に対し、制御パラメータと位置決めストロークを設定し、それらの全組み合わせで位置決め動作させ、パラメータ空間内の全探索データを取得した。なお同じ制御パラメータに対する動作の再現性は今回の実験では問題なく担保されている。」(220頁右欄19行〜36行)

(エ)「まず、今回の実験装置の概略構成をFig. 3に示す。これは制御パラメータの調整について、同一コントローラ、同一メカのまま、熟練作業者が行なっている作業を能動型探索アルゴリズムに切り替えて実験する構成である。
つぎに位置決めサーボの制御ブロック線図をFig.4に示す。こちらはいわゆる2自由度制御系である。フィードフォワード部について、位置のP制御、速度のP制御、および機械モデル1/J・sで構成し、フィードバック部について、位置のP制御、速度のPI制御で構成してある。
フィードフォワード部について、位置応答ゲインをωpc1、速度ゲインをωsc1とし、ωsc1についてはωsc1=4・J・ωpc1としωpc1に従属して自動的に定まることとした。
またフィードバック部について、位置応答ゲインをωpc2、速度ゲインをωsc2、速度積分時間をTiとする。
上述の実験装置において、適当な制御パラメータを設定し、適当な移動ストロークを経て位置決めする動作を実行するとFig.5のような波形データが観測され、与えた制御パラメータおよび移動ストロークの組み合わせに対する評価指標値を計測することができる。評価指標としては『許容整定範囲割れ』『整定時間』『オーバーシュート量』があり、これら評価指標は未知の制約条件付きの未知の目的関数を描く。評価値のそれぞれを説明する。
・許容整定範囲割れ:0または1いずれかの数値。
指令位置に対する偏差が別途与えられる許容範囲内に収まっていない状態のこと。以下の基準に照らすとFig. 5の観測波形は「許容整定範囲割れ」1と判定される。
0:位置決め指令入力以降、位置偏差が最初に許容範囲内に入ってから、次回指令入力まで許容範囲外になることがない場合(良い)。
1:位置決め指令入力以降、位置偏差が最初に許容範囲内に入ってから、次回指令入力まで許容範囲外になることがある場合(悪い)。
・整定時間[msec]:位置決め指令入力以降、位置偏差が最後に許容範囲内に入るまでの時間(小さいほど良い)。
・オーバーシュート量[pulse]:指令入力以降、最初に許容範囲内に入ってからの位置偏差の行き過ぎ最大値(小さいほど良い)。
『許容整定範囲割れ』『オーバーシュート量』についてはモータ軸に取り付けられた1回転あたり13万パルス(217=131,072pulse)の分解能をもつエンコーダで計測する。今回の実験装置では、ボールねじのリードは10mmであり、その1回転でナット側は10mm移動するので、エンコーダの1pulseはナット側が0.07629μm移動することに相当する。このとき、許容される整定幅を50pulseと与えれば、目標位置に対し3.815μm以内のズレ量で整定したとき『許容整定範囲割れ』は発生していないことになる。またオーバーシュート量を50pulseと計測すれば、実際には4μmほどオーバーシュートしていたことになる。ただし、これらの数値はモータ軸に取り付けたエンコーダの回転角度を計測しているので、モータ軸からボールねじ、ボールねじと嵌合しているナット、ナットから先の部材といった伝逹機構を経た機械端がこれらの値どおりに動くものではないが今回は問題とはならないレベルである。機械端の動きをリニアエンコーダなどで計測しフィードバックループを組んで機械端の位置決め精度を高めることはもちろん可能であるが、ここでの議論とは直交する話題である。
以下、本論文では、上述の位置決め実験装置に対して、操作可能な制御パラメータのうち、フィードバック系の応答と安定にかかるゲインωpc2とωsc2は事前に参考文献30)に示した方法で適正に調整されているという前提で、『オーバーシュート量』と『整定時間』の特性を決めるゲインωpc1とTiを、提案アルゴリズムにより探索的に自動調整し、指定された目標仕様を満たす最適化について考察することにする。」(220頁右欄37行〜222頁左欄15行)

(オ)「4.1 調整に対する要求仕様について
現場の制御パラメータ調整では上述の評価値に対する位置決め目標仕様が指定 される。これを位置決め前の移動ストローク、位置決め場所(5章にて後述)などの誤差因子に対してロバスト化する必要がある。」(222頁左欄16行〜20行)

(カ)「4.2 今回の実験方法について
本稿では前述のとおり、位置決め実験装置を用いて制御パラメータの定義域内と位置決めストローク組み合わせ空間の全探索を実施しデータを取得した。」(222頁左欄33行〜36行)

(キ)「4.3 多目的最適化の実装について
能動型探索アルゴリズムを今回の問題における多目的最適化に適用するための実装の考え方について述べる。具体的には、最適化目標が「許容整定範囲割れ」、「整定時間」、「オーバーシュート量」の3つあり、動作ストロークも4種類あるため、アルゴリズムを計算するなかで、これらの事項をどのように取り扱うかである。
制御パラメータは自分で操作できる制御因子であるが、移動ストローク1mm、5mm、20mm、50mmは受け入れるしかない(自分で操作できない)誤差因子と考えることにする。移動ストロークは4つあるので、各制御パラメータ組み合わせごとに4つの実測値が得られるが、それらの最悪値を採用することで移動ストロークの変動に対してロバストな評価値とする。
一方、各評価値に対する実行不能判定は、優先順位をもって実施する。具体的には「許容整定範囲割れ」>「整定時間」>「オーバーシュート量」とする。そして最も厳しく判定したい「許容整定範囲割れ」の0,1を用いて、未知の制約条件の識別境界の推定モデルf(Sn,x)=0を更新し、最良の試行結果を選ぶ際の優劣の判定に上述の優先順位を用いる。たとえば『整定時間』が改良されれば『オーバーシュート量』が悪くなっていても良い解が見つかったと判断することになる。」(222頁右欄5行〜26行)

(ク)「4.4 適用結果
まず、前節の手順に従い、実測値から求めた2つのデータセットをFig.6に示す。これが全探索のデータとなる。」(222頁右欄42〜44行)

(ケ)「7.おわりに
産業メカトロニクス分野で用いられる位置決めサーボシステムの制御パラメータ調整、すなわち制御パラメータの調整において発生している未知の目的関数の最適化問題に対して、著者らの開発した機械学習の枠組みに基づく能動型探索アルゴリズムの適用可能性を検討した。」(226頁右欄20〜25行)

上記記載事項(ア)〜(ケ)から、以下の事項が理解できる。
(コ)上記(ア)、(エ)、(キ)から、甲1には、位置決めサーボシステムの許容整定範囲割れ、整定時間、オーバーシュート量の評価指標について、多目的最適化をすることが開示されていると理解できる。

(サ)上記(ア)、(ウ)〜(ケ)から、甲1には、制御パラメータ(サーボパラメータ)を機械学習、特に能動型探索アルゴリズムにより自動調整する装置が開示されているといえる。

イ 甲1発明
上記アから、甲1には以下の発明(以下「甲1発明」という。)が開示されていると認められる。
位置決めサーボシステムの許容整定範囲割れ、整定時間、オーバーシュート量の評価指標について、多目的最適化をするため、操作可能な制御パラメータのうち、オーバーシュート量と整定時間の特性を決める位置応答ゲインωpc1と速度積分時間Tiを、機械学習、特に能動型探索アルゴリズムにより探索的に自動調整するものであって、「許容整定範囲割れ」>「整定時間」>「オーバーシュート量」の優先順位で最良の試行結果を選ぶ、制御パラメータ(サーボパラメータ)を機械学習により自動調整する装置。

ウ 本件発明1について
本件発明1と甲1発明とを対比すると、甲1発明の「位置決めサーボシステム」は、本件発明1の「モータ駆動装置」に相当し、同様に「制御パラメータ(サーボパラメータ)を機械学習により自動調整する装置」は、「機械学習装置」に相当する。
また、甲1発明の「位置決めサーボシステムの・・・操作可能な制御パラメータ」は、本件発明1の「モータ駆動装置においてモータを制御するための指令値」と、「モータ駆動装置においてモータを制御するための制御パラメータ」である点で一致し、甲1発明の「制御パラメータのうち、オーバーシュート量と整定時間の特性を決める位置応答ゲインωpc1と速度積分時間Ti」は、本件発明1の「指令値の補正に用いられる補正パラメータ」と、「制御パラメータの補正に用いられる補正パラメータ」という点で一致する。そうすると、甲1発明の「オーバーシュート量と整定時間の特性を決める位置応答ゲインωpc1と速度積分時間Tiを、機械学習、特に能動型探索アルゴリズムにより探索的に自動調整するもの」は、本件発明1の「補正パラメータを学習する機械学習装置」に相当する。
そして、甲1発明において「「許容整定範囲割れ」>「整定時間」>「オーバーシュート量」の優先順位で最良の試行結果を選ぶ」ことは、能動型探索アルゴリズムにより、探索的な自動調整によってなされるものであるから、本件発明1において「前記補正パラメータを前記補正機能毎に学習する」ことと、「前記補正パラメータを学習する」点で一致する。
そうすると、本件発明1と甲1発明とは以下の一致点、相違点を有する。

一致点:モータ駆動装置においてモータを制御するための制御パラメータの補正に用いられる補正パラメータを学習する機械学習装置であって、前記補正パラメータを学習する機械学習装置。

相違点:本件発明1は、「複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置であって、前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、前記補正パラメータとを状態変数として観測する状態観測部と、前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する学習部と、を備える」もの、すなわち、モータ駆動装置が複数の種類の補正機能を有するものであり、特徴量は、補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出されるものであり、学習部は、補正機能毎に作成される訓練データセットに従って、訓練データセットに含まれる状態変数を用いて補正パラメータを補正機能毎に学習するものであるのに対し、甲1発明は、許容整定範囲割れ、整定時間、オーバーシュート量の評価指標について多目的最適化するものの、複数の種類の補正機能を有するものではなく、したがって、特徴量の抽出及び学習部についても補正機能毎になされるものではない点。

上記相違点について検討すると、甲1には補正機能毎に機械学習を行うことについては開示もないし示唆もない。
すなわち、本件発明1は、補正機能毎に補正パラメータの学習が行われるから、補正機能の間には優先順位などはなく、補正機能の数に応じた分だけ、最適な補正パラメータが選定されるように学習する。
これに対して、甲1における多目的最適化は、「許容整定範囲割れ」>「整定時間」>「オーバーシュート量」という優先順位を前提に、最良の試行結果、すなわち「位置応答ゲインωpc1」と「速度積分時間Ti」の値を1つに選定することであるから、その結果として、「整定時間」が改良されれば、「オーバーシュート量」が悪くなっていても良い解が見つかったと判断されることになる(上記ア(キ))が、このような判断は、補正機能毎に最適な補正パラメータを選定しようとする本件発明1の技術的思想とは異なるものであって、甲1には補正機能毎に機械学習を行うことについては開示も示唆もないというほかない。
また、甲第2号証〜甲第6号証を見ても、甲1発明のような機械学習装置について、補正機能毎に機械学習を行うこと、そのために、特徴量をモータ駆動装置の駆動データから計算により切り取られ抽出されたものとすること、このような特徴量と補正パラメータとを状態変数として観測する状態観測部や、状態変数に基づいて補正機能毎に作成される訓練データセットに従って、訓練データセットに含まれる状態変数を用いて補正パラメータを補正機能毎に学習する学習部を備えることを開示するものはない。
そうすると、当業者であっても、甲1発明に、相違点に係る本件発明1の構成を採用することは容易に想到し得たものではない。

エ 本件発明2〜11について
上記ウのとおり、本件発明1が、甲1発明及び甲第2号証〜甲第6号証に記載の技術的事項から容易に想到し得たものではないところ、本件発明2〜10は、本件発明1の発明特定事項の全てを含むものであるから、上記本件発明1と甲1発明との相違点と同じ相違点を有するものであり、甲1発明及び甲第2号証〜甲第6号証に記載の技術的事項から容易に想到し得たものではない。
また、本件発明11は、機械学習方法の発明であるところ、甲1には甲1発明に対応する方法の発明も開示されているといえるが、本件発明11と、当該甲1発明に対応する方法の発明を対比すると、上記本件発明1と甲1発明との相違点と同様の相違点を有するものと認められ、本件発明11は甲1発明に対応する方法の発明及び甲第2号証〜甲第6号証に記載の技術的事項から容易に想到し得たものではない。

オ 小括
以上のとおり、本件発明1〜11に係る特許は、特許法第29条第2項の規定に違反してなされたものとはいえない。

(2)記載要件違反
ア 具体的な特許異議申立理由
本件訂正前の特許請求の範囲及び明細書の発明の詳細な説明の記載に対する記載要件違反について、特許異議申立の具体的理由は以下のとおりである。

(ア)請求項1、2について
a 請求項1の「補正機能の種類に基づいて計算された特徴量」について、複数の補正機能の種類毎の「特徴量」が、それぞれ如何なる量であるのか不明確であるとともに、「特徴量」を計算するための入力データが何かが不明確であり、「モータ駆動装置の駆動データ」との関係の有無も不明確である。上記請求項1を引用する訂正前の請求項2についても同様である(以下のb〜cについても同じ。)。

b 同じく「状態変数に基づいて作成される訓練データセットに従って、前記補正パラメータを前記補正機能毎に学習する学習部」について、「訓練データセット」がどのようなデータを含むデータセットを意味するものか不明確である。また、「補正機能毎に学習する」ことを可能にする「訓練データセット」とはどのようなものか不明確である。

c 上記bの「学習部」について、「訓練データセットに従って」どのようにして、「補正パラメータを補正機能毎に学習する」ものか、その学習内容が不明確である。

d 本件明細書は、「訓練データセット」について、段落【0020】の記載があるのみであるから、その作成を当業者が実施できる程度に明確かつ十分な記載となっていない。同じく、「学習部」について、段落【0020】の記載があるのみで、「訓練データセットに従って」どのようにして、「補正パラメータを補正機能毎に学習する」のか記載がないから、当業者が実施できる程度に明確かつ十分な記載となっていない。また、「学習部」については、段落【0058】に、ニューラルネットワーク等を用いても良い旨の記載があるところ、このような方法による場合には、どのように学習すれば良いのか、当業者が実施できる程度に明確かつ十分な記載となっていない。

(イ)請求項3について
上記(ア)a〜cと同じ点で不明確である。

(ウ)請求項4について
a 請求項4の「状態変数に基づいて報酬を計算する報酬計算部」、「前記報酬に基づいて、前記補正パラメータを決定するための関数を更新する関数更新部」が、上記請求項4が引用する上記請求項1の「状態変数に基づいて作成される訓練データセットに従って、前記補正パラメータを前記補正機能毎に学習する」こととどのような関係にあるのか不明確である。

b 本件明細書には、「前記報酬に基づいて、前記補正パラメータを決定するための関数を更新する関数更新部」について、段落【0053】の記載があるのみであり、報酬は閾値との関係で定まるに過ぎず、補正パラメータ間の優劣を決めるものではないところ、補正パラメータをどのように決定するかが不明であるから、当業者が実施できる程度に明確かつ十分な記載となっていない。

(エ)請求項5について
a 訂正前の請求項5には、「関数更新部は、前記補正機能毎に前記関数を更新する」ことが記載されているが、これを考慮しても、上記請求項5が間接的に引用する上記請求項1の「状態変数に基づいて作成される訓練データセットに従って、前記補正パラメータを前記補正機能毎に学習する」こととどのような関係にあるのか不明確である。

(オ)請求項6〜10について
a 請求項6は、上記請求項1ないし5を選択的に引用し、訂正前の請求項7−10は上記請求項6を引用するものであるところ、上記(ア)a〜c、(ウ)a、(エ)と同じ点で不明確である。請求項6を引用する請求項7〜10についても同様に不明確である。

b 請求項6は、「前記複数の種類の補正機能のうちの1つを選択する補正機能選択部」により選択された補正機能についての補正パラメータを決定するものであるところ、本願明細書の段落【0005】、【0006】の解決しようとする課題(従来技術では、単一の補正機能の補正パラメータしか調整することができなかったこと)及び目的(複数の補正パラメータに対応できるようにすること)の記載に鑑みて、発明が解決しようとする課題を解決できないものであるから、本件明細書は、当業者が実施できる程度に明確かつ十分な記載となっていない。請求項6を引用する請求項7〜10についても同様である。

(カ)請求項9について
a 請求項9には、「補正パラメータ計算部」が、「学習結果に基づいて補正パラメータを計算」することが記載されているが、その計算内容が不明確である。

b 本件明細書は、「補正パラメータ計算部」について、段落【0022】の記載があるのみであるから、その計算を当業者が実施できる程度に明確かつ十分な記載となっていない。

(キ)請求項11について
請求項11は、上記請求項1が機械学習装置についての発明であるのに対し、機械学習方法の発明である点でカテゴリーが相違する他は、上記請求項1と同様の特定がされているものであるところ、上記(ア)a〜cの上記請求項1、2についての理由と同様に、上記請求項11の記載は不明確である。

イ 記載要件の判断
(ア)請求項1、2について
a 請求項1の「補正機能の種類に基づいて計算された特徴量」について、本件訂正により、「前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量」となった結果、「特徴量」が、モータ駆動装置の駆動データから計算により切り取られ抽出されたものであることが明確となった。
また、本件明細書の段落【0017】、【0018】には、「特徴量抽出部14は、アルゴリズム選択部61と、アルゴリズム記憶部62と、特徴量計算部63とを有する。・・・特徴量計算部63は、アルゴリズム選択部61から入力される計算アルゴリズム選択指令に基づいて、使用する計算アルゴリズムをアルゴリズム記憶部62から取出して、取出した計算アルゴリズムを用いて、学習用駆動データDeから補正機能ごとに特徴量を計算する。・・・
摩擦補正機能については、アルゴリズム選択部61は、運動方向反転位置検出、運動方向反転時近傍のデータ切り取りを選択する。学習用駆動データDeに、位置指令、位置フィードバック、モータ電流、理想的な位置に対する実際の位置のデータが含まれている場合、特徴量計算部63は、それぞれのデータに関して、選択された計算アルゴリズムを適用して特徴量を算出する。」との記載があるところ、「特徴量」が、補正機能に応じて、学習用駆動データDeに含まれる位置指令、位置フィードバック等のデータから計算アルゴリズムを適用して計算(例えば、摩擦補正機能であれば、運動方向反転時の近傍のデータを切り取るような計算)される量であることは、当該記載からも明らかである。

b 請求項1の「訓練データセット」に関し、本件訂正により、「前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する学習部と、」との特定事項を有するものとなった結果、「訓練データセット」が状態変数(特徴量及び補正パラメータ)を含むものであること、状態変数に基づいて前記補正機能毎に作成されるものであることが明確となった。

c 請求項1の「学習部」について、上記bのとおりの発明特定事項を備えるものとなった結果、その学習内容が明確となった。
よって、上記ア(ア)a〜cについて、本件発明1、2は明確である。

d 本件訂正により、本件発明1の訓練データが補正機能毎に作成されるものであることが明確になり、学習部についても、上記cのとおり明確となった。
また、実施可能要件について、本件明細書の段落【0020】には、「状態観測部101は、補正パラメータ情報および特徴量を用いて、補正パラメータと、補正機能に基づいて抽出された特徴量とを状態変数として観測する。状態観測部101は、状態変数に基づいて、補正機能毎に訓練データセットを作成して出力する。学習部102は、状態観測部101が状態変数に基づいて作成した訓練データセットを用いて、特徴量毎に、つまり、補正機能毎に補正パラメータの学習を行い、学習結果Frを出力する。学習部102が用いる学習アルゴリズムは、ニューラルネットワークのような教師あり学習、教師なし学習、強化学習などである。」と記載されており、本件発明1の発明特定事項とも整合するところ、上記発明の詳細な説明の記載及び機械学習についての技術常識を踏まえれば、当業者が過度の試行錯誤を要することなく本件発明1を実施し得る程度ものといえる。
よって、上記ア(ア)dについて、本件明細書の発明の詳細な説明の記載は、実施可能要件を充足する。

(イ)請求項3について
上記(ア)のとおりである。
また、請求項3は、特徴量について特定をするものであって、請求項1を引用するものであるところ、特徴量が「補正機能毎の前記駆動データの特性を示すデータ」であることに関し、請求項1には、「前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量」との発明特定事項があるから、駆動データの特性を示すデータが駆動データから計算により切り取られ抽出されるものであることが理解できるし、本件明細書の段落【0016】〜【0018】の特徴量の抽出に関する記載からも理解できる。
よって、上記ア(イ)について、本件発明3は明確である。

(ウ)請求項4について
a 請求項4の「状態変数に基づいて報酬を計算する報酬計算部」、「前記報酬に基づいて、前記補正パラメータを決定するための関数を更新する関数更新部」について、本件訂正により、請求項4が引用する請求項1が「前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する」と特定するものとなったことから、訓練データセットに状態変数が含まれることが明確となり、「報酬計算部」が訓練データセットに含まれる状態変数に基づいて報酬を計算するものであること、「関数更新部」が当該報酬に基づいて関数を更新するものであることが明確となった。
よって、上記ア(ウ)aについて、本件発明4は明確である。

b 請求項4は本件発明1を引用する請求項であるところ、本件訂正により、本件発明1の訓練データセットに状態変数が含まれることが明確となった結果、本件発明4における「前記状態変数に基づいて報酬を計算する報酬計算部」と、「前記報酬に基づいて、前記補正パラメータを決定するための関数を更新する関数更新部」が、訓練データセットに含まれる状態変数に基づいて報酬を計算し、当該計算された報酬に基づいて補正パラメータを決定するための関数を更新する処理を行うことが明確となった。
これを踏まえ、本件明細書の段落【0053】の「報酬計算部102aは、状態観測部101により観測された状態変数に基づいて報酬を計算する。報酬計算部102aは、補正機能ごとに、報酬を計算する。」、段落【0054】の「関数更新部102bは、報酬計算部102aによって計算される報酬に従って、補正パラメータを決定するための関数を更新する。」との記載及び機械学習についての技術常識を踏まえれば、当業者が過度の試行錯誤を要することなく本件発明4を実施し得る程度のものといえる。
よって、上記ア(ウ)bについて、本件明細書の発明の詳細な説明の記載は、実施可能要件を充足する。

(エ)請求項5について
a 上記(ウ)aのとおり、関数更新部と請求項1の特定事項との関係が明確になったことから、請求項5の「関数更新部は、前記補正機能毎に前記関数を更新する」ことと請求項1の発明特定事項との関係についても明確となった。
よって、上記ア(エ)aについて、本件発明5は明確である。

(オ)請求項6〜10について
a 上記(ア)〜(エ)のとおりであるから、上記ア(オ)aについて、本件発明6〜10は明確である。

b 請求項6は、本件発明1を引用する請求項であるところ、本件発明1は、「複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置」との発明特定事項を有するから、本件発明6は、複数の種類の補正機能を有することを前提とするものである。
一方、本件明細書の段落【0005】、【0006】には、「しかしながら、上記特許文献1に記載の技術では、単一の補正機能の補正パラメータしか調整するアルゴリズムしかないため、単一の補正機能の補正パラメータしか調整することができない。・・・本発明は、上記に鑑みてなされたものであって、複数の種類の補正機能を有するモータ駆動装置であっても、モータ駆動装置の指令値の補正条件を決定するための補正パラメータを容易に調整することが可能な機械学習装置および補正パラメータ調整装置を得ることを目的とする。」と記載されるとおり、従来は単一の補正機能のみを有するものであったところ、本件発明は、複数の種類の補正機能を有するモータ駆動装置に対応できるようにしたものである。
そうすると、上記ア(オ)bについて、本件発明6及び本件発明6を引用する本件発明7〜10は、発明が解決しようとする課題を解決できないものではないし、本件明細書の発明の詳細な説明の記載は、実施可能要件を充足する。

(カ)請求項9について
a 請求項9には、「補正パラメータ計算部」が、「学習結果に基づいて補正パラメータを計算」することを特定しており、その記載自体は明確であるから、上記ア(カ)aについて、本件発明9は明確である。

b 本件明細書の段落【0022】の「補正パラメータ計算部51は、機械学習装置100から入力される学習結果Frと、補正パラメータ情報とに基づいて、補正機能毎に、学習結果Frに基づいて補正パラメータを算出する。・・・終了判定部53は、補正パラメータ評価部52の評価結果と、調整要件入力部11から入力される調整要件とに基づいて、調整処理を終了するか否かを判断すると共に、補正パラメータ計算部51が計算した補正パラメータをモータ駆動装置99に設定する。」との記載、【0047】〜【0048】の「機械学習装置100は、発生する誤差を抑制することが可能な補正パラメータを学習する・・・エージェントは、行動を選択することで環境から報酬を得て、一連の行動を通じて報酬が最も多く得られるような方策を学習する。」との記載から、「補正パラメータ計算部」が、「学習結果に基づいて補正パラメータを計算」することは、例えば、学習結果Frから、報酬が最も多く得られるような補正パラメータを計算することでなされることが理解できる。
よって、上記ア(カ)bについて、本件明細書の発明の詳細な説明の記載は、実施可能要件を充足する。

(キ)請求項11について
上記(ア)a〜cの請求項1、2についてと同様に、上記ア(キ)について、本件発明11は明確である。

ウ 小括
以上のとおり、本件特許請求の範囲及び本件明細書の発明の詳細な説明の記載は、特許法第36条第4項第1号、同条第6項第2号の規定に違反していないから、本件発明1〜11に係る特許は、当該規定に違反してなされたものとはいえない。

第7 まとめ
以上のとおり、本件発明1〜11に係る特許は、令和4年3月9日付け取消理由通知(決定予告)に記載した取消理由、特許異議申立書に記載された特許異議申立理由によっては、取り消すことはできない。さらに、他に本件発明1〜11に係る特許を取り消すべき理由を発見しない。
よって、結論のとおり決定する。
 
発明の名称 (54)【発明の名称】機械学習装置、補正パラメータ調整装置および機械学習方法
【技術分野】
【0001】
本発明は、複数の種類の補正機能を有するモータ駆動装置の補正機能で用いられる補正パラメータを学習する機械学習装置、補正パラメータ調整装置および機械学習方法に関する。
【背景技術】
【0002】
モータによって駆動されるモータ駆動装置は、例えば、工作機械、産業用機械、ロボット、搬送機である。モータ駆動装置では、工具、加工対象物、ハンドといった制御対象が、与えられた指令値に追従するように制御される。しかしながら、モータ駆動装置を構成する機械構造および機械要素には、さまざまな誤差要因および外乱要因が内在するため、指令値への追従精度が低下することがある。誤差要因は、摺動面の摩擦、構造部材の剛性不足、組み立て誤差、制御の遅れ、モータの発熱などである。このため、誤差を考慮して指令値を補正して用いることが考えられる。指令値の補正量、補正タイミングといった補正条件は、モータ駆動装置の構造の違い、個体差、設置される環境の違いなどによって、最適な値が異なる。
【0003】
作業者が補正条件をモータ駆動装置毎に調整するためには、手間がかかると共に、適した補正条件を調整することができるようになるまでには、習熟期間を要する。このため、補正条件を自動で調整する装置が検討されている。特許文献1には、摩擦の影響によって発生する運動誤差の補正条件を決定するための補正パラメータを用いて、補正条件を自動的に決定する技術が開示されている。この技術では、摩擦の影響によって発生する運動誤差の補正条件を決定するための補正パラメータを変更して、円弧運動中に発生する応答誤差が閾値以下となるまでトルク指令の補正および補正トルクの更新を繰り返し、摩擦補正に関する補正パラメータを自動で決定する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平11−24754号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載の技術では、単一の補正機能の補正パラメータしか調整するアルゴリズムしかないため、単一の補正機能の補正パラメータしか調整することができない。補正機能の補正パラメータを調整するアルゴリズムの作成は、非常に時間と手間がかかる作業であり、モータ駆動装置が複数の種類の補正機能を有する場合には、各補正機能に合わせて補正パラメータを調整するアルゴリズムを個々に作成する必要があり、アルゴリズムの作成に要す時間と手間が膨大となるという問題があった。
【0006】
本発明は、上記に鑑みてなされたものであって、複数の種類の補正機能を有するモータ駆動装置であっても、モータ駆動装置の指令値の補正条件を決定するための補正パラメータを容易に調整することが可能な機械学習装置および補正パラメータ調整装置を得ることを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明は、複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置であって、補正機能の種類に基づいて、モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、補正パラメータとを状態変数として観測する状態観測部と、状態変数に基づいて補正機能毎に作成される訓練データセットに従って、訓練データセットに含まれる状態変数を用いて補正パラメータを補正機能毎に学習する学習部と、を備えることを特徴とする。
【発明の効果】
【0008】
本発明にかかる機械学習装置は、複数の種類の補正機能を有するモータ駆動装置であっても、モータ駆動装置の指令値の補正条件を決定するための補正パラメータを容易に調整することが可能であるという効果を奏する。
【図面の簡単な説明】
【0009】
【図1】本発明の実施の形態1にかかる補正パラメータ調整装置の機能構成を示す図
【図2】図1に示す特徴量抽出部の構成を示す図
【図3】図1に示す機械学習装置の構成を示す図
【図4】図1に示す補正パラメータ決定部の構成を示す図
【図5】図1に示すモータ駆動装置の構成を示す図
【図6】図5に示す機械装置の構成を示す図
【図7】図5に示すサーボ制御部の構成を示す図
【図8】図1に示す補正パラメータ調整装置のハードウェア構成例を示す図
【図9】図1に示す補正パラメータ調整装置の動作を示すフローチャート
【図10】機械学習装置が強化学習を用いる場合の図3に示す学習部の構成を示す図
【図11】図3に示す機械学習装置が強化学習を使用する場合の学習部の動作を示す図
【図12】本発明の実施の形態2にかかる補正パラメータ調整装置の構成を示す図
【図13】本発明の実施の形態3にかかる補正パラメータ調整装置の構成を示す図
【図14】図13に示す補正パラメータ決定部の構成を示す図
【発明を実施するための形態】
【0010】
以下に、本発明の実施の形態にかかる機械学習装置、補正パラメータ調整装置および機械学習方法を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
【0011】
実施の形態1.
図1は、本発明の実施の形態1にかかる補正パラメータ調整装置1の機能構成を示す図である。補正パラメータ調整装置1は、機械学習を用いて、モータ駆動装置99の指令値の補正条件を決定するための補正パラメータを調整する。補正パラメータ調整装置1は、調整要件入力部11と、補正機能選択部12と、駆動データ取得部13と、特徴量抽出部14と、補正パラメータ決定部15と、機械学習装置100とを備える。
【0012】
調整要件入力部11は、補正パラメータの調整を終了するか否かを判断するための調整要件の入力を受け付ける。調整要件は、目標とする精度、目標とするタクトタイム、許容しうる最大誤差、調整時間などである。調整要件入力部11は、複数の調整要件の組み合わせを受け付けることもできる。調整要件入力部11は、受け付けた調整要件を補正パラメータ決定部15に入力する。
【0013】
補正機能選択部12は、モータ駆動装置99の有する補正機能の種類と、補正機能の内容を示す情報と、補正機能を実行する際に使用される補正パラメータを示す補正パラメータ情報とが記憶された補正機能情報記憶部16から、モータ駆動装置99の有する補正機能の種類と、補正パラメータ情報とを取得し、調整に使用する補正機能を選択する。補正機能とは、ある目的の効果を実現するための動作の単位であり、摩擦の影響によって発生する運動誤差を補正する機能、振動抑制機能、軸間干渉補正機能などである。補正機能の内容を示す情報は、補正対象の誤差要因、補正量を計算するために必要な状態量、補正量を印加する制御量、補正量の演算式、補正量演算に必要な補正パラメータ数などである。補正パラメータ情報は、補正パラメータが依存する状態量などである。
【0014】
補正機能選択部12は、予め定められた補正機能の組み合わせを順番に選択してもよいし、操作者から補正機能を選択する入力を受け付けてもよい。補正機能選択部12は、選択した補正機能の補正パラメータ情報を機械学習装置100に入力し、補正機能情報を特徴量抽出部14に入力する。補正機能情報は、選択した補正機能を識別するための情報と、補正機能の内容を示す情報とを含む。
【0015】
駆動データ取得部13は、モータ駆動装置99から学習用駆動データDeと、検証用駆動データDvとを取得する。学習用駆動データDeおよび検証用駆動データDvは、モータ駆動装置99の駆動に関する情報であり、モータの位置指令、速度指令、電流指令といった、モータ駆動装置99を駆動するモータへの指令情報、位置フィードバック、速度フィードバック、電流フィードバックといったモータ駆動装置99を駆動するモータからのフィードバックデータ、誤差が存在しない場合の理想的なモータ位置、モータ速度、モータ電流といったモータの状態情報、モータの制御対象である機械装置の駆動データのうち少なくとも1つを含む。また、学習用駆動データDeおよび検証用駆動データDvは、理想的なモータ位置と実際のモータ位置との差、理想的なモータ速度と実際のモータ速度の差を含んでもよい。学習用駆動データDeと検証用駆動データDvとは同じ種類のデータであってもよいし、異なる種類のデータであってもよい。駆動データ取得部13は、取得した学習用駆動データDeを特徴量抽出部14に入力し、取得した検証用駆動データDvを補正パラメータ決定部15に入力する。
【0016】
特徴量抽出部14は、駆動データ取得部13から入力される学習用駆動データDeから、補正機能選択部12より入力される補正機能情報に基づいて、補正機能ごとに特徴量Fvを抽出する。特徴量抽出部14は、調整対象として選択された補正機能の数と同じ数の特徴量Fvを抽出する。1つの特徴量Fvは、補正機能ごとの駆動データの特性を示すデータであり、一次元のスカラ量ではなく複数次元のベクトル量である。特徴量抽出部14は、抽出した特徴量Fvを機械学習装置100に入力する。
【0017】
図2は、図1に示す特徴量抽出部14の構成を示す図である。特徴量抽出部14は、アルゴリズム選択部61と、アルゴリズム記憶部62と、特徴量計算部63とを有する。アルゴリズム選択部61は、補正機能情報から調整対象となる補正機能を示す情報を取得し、補正機能ごとに学習用駆動データDeから特徴量を抽出するために使用するアルゴリズムを選択する。アルゴリズム選択部61は、補正機能ごとに選択したアルゴリズムを示す計算アルゴリズム選択指令を特徴量計算部63に入力する。アルゴリズム記憶部62には、ローパスフィルタ、ハイパスフィルタ、バンドパスフィルタ、バンドエリミネイトフィルタなどの各種フィルタ、運動方向反転位置検出、速度ゼロ近傍検出、コーナ部検出などの運動特徴波形抽出、データ切り取り処理などを実行するための計算アルゴリズムを示す関数群が格納されている。データの切り取りは、データを切り取って切り取った部分を抽出することを指す。特徴量計算部63は、アルゴリズム選択部61から入力される計算アルゴリズム選択指令に基づいて、使用する計算アルゴリズムをアルゴリズム記憶部62から取出して、取出した計算アルゴリズムを用いて、学習用駆動データDeから補正機能ごとに特徴量を計算する。
【0018】
摩擦補正機能については、アルゴリズム選択部61は、運動方向反転位置検出、運動方向反転時近傍のデータ切り取りを選択する。学習用駆動データDeに、位置指令、位置フィードバック、モータ電流、理想的な位置に対する実際の位置のデータが含まれている場合、特徴量計算部63は、それぞれのデータに関して、選択された計算アルゴリズムを適用して特徴量を算出する。また、振動補正機能については、アルゴリズム選択部61は、運動停止直後のデータの切り取り、バンドパスフィルタを選択する。
【0019】
図1の説明に戻る。機械学習装置100は、補正機能選択部12から入力される補正機能情報および補正パラメータ情報と、特徴量抽出部14から入力される特徴量Fvとに基づいて、補正パラメータを特徴量Fvごとに学習する。機械学習装置100は、モータ駆動装置99の駆動データに含まれる誤差を抑制するような補正条件を設定可能な補正パラメータを学習する。機械学習装置100は、学習結果Frと、補正パラメータ情報とを補正パラメータ決定部15に入力する。
【0020】
図3は、図1に示す機械学習装置100の構成を示す図である。機械学習装置100は、状態観測部101と、学習部102とを有する。状態観測部101は、補正パラメータ情報および特徴量を用いて、補正パラメータと、補正機能に基づいて抽出された特徴量とを状態変数として観測する。状態観測部101は、状態変数に基づいて、補正機能毎に訓練データセットを作成して出力する。学習部102は、状態観測部101が状態変数に基づいて作成した訓練データセットを用いて、特徴量毎に、つまり、補正機能毎に補正パラメータの学習を行い、学習結果Frを出力する。学習部102が用いる学習アルゴリズムは、ニューラルネットワークのような教師あり学習、教師なし学習、強化学習などである。
【0021】
図1の説明に戻る。補正パラメータ決定部15は、機械学習装置100から入力される学習結果Frおよび補正パラメータ情報に基づいて、補正パラメータを決定し、決定した補正パラメータをモータ駆動装置99に設定すると共に、調整要件入力部11から入力される調整要件と、駆動データ取得部13から入力される検証用駆動データDvとに基づいて、補正パラメータの調整処理を終了するか否かを判定する。
【0022】
図4は、図1に示す補正パラメータ決定部15の構成を示す図である。補正パラメータ決定部15は、補正パラメータ計算部51と、補正パラメータ評価部52と、終了判定部53とを有する。補正パラメータ計算部51は、機械学習装置100から入力される学習結果Frと、補正パラメータ情報とに基づいて、補正機能毎に、学習結果Frに基づいて補正パラメータを算出する。補正パラメータ評価部52は、検証用駆動データDvに基づいて、現在設定されている補正パラメータの妥当性を評価する。終了判定部53は、補正パラメータ評価部52の評価結果と、調整要件入力部11から入力される調整要件とに基づいて、調整処理を終了するか否かを判断すると共に、補正パラメータ計算部51が計算した補正パラメータをモータ駆動装置99に設定する。
【0023】
ここで、モータ駆動装置99の構成例について説明する。図5は、図1に示すモータ駆動装置99の構成を示す図である。モータ駆動装置99は、モータ2と、機械装置3と、モータ位置検出器4と、指令値生成部5と、サーボ制御部6と、補正量演算部7とを有する。ここでは1つのモータ2しか図示していないが、モータ駆動装置99は、1つのモータ2を有していてもよいし、2つ以上のモータ2を有していてもよい。
【0024】
モータ2は、アクチュエータであり、具体的には、回転モータである。モータ2には、機械装置3と、モータ2の位置を検出するモータ位置検出器4とが接続されている。モータ2は、供給されるモータ電流Imに従って回転し、回転トルクTmにより機械装置3を駆動する。
【0025】
図6は、図5に示す機械装置3の構成を示す図である。機械装置3は、水平に配置されたベッド89と、ベッド89に固定される案内機構86a,86bと、案内機構86a,86bによって支持され、可動方向が制限されたテーブル84とを備える。また、機械装置3は、テーブル84の一面に設けられた図示しないナットと、テーブル84とから構成される可動部が組みつけられたボールねじ82と、ボールねじ82を保持するボールフロントベアリング87aと、リアベアリング87bとを備える。モータ2の回転軸には、リジッドカプリング88を介してボールねじ82が連結されている。ここでは、軸受の方式として、ボールフロントベアリング87aはアンギュラコンタクト玉軸受で固定され、リアベアリング87bは深溝玉軸受で支持されるシングルアンカ方式が用いられる。
【0026】
テーブル84は、案内機構86a,86bによって支持されているため、可動方向以外の運動は制約されている。ここでは、案内機構86a,86bは、剛球を転動体としグリスで潤滑される直動転がり案内機構であるとする。機械装置3は、テーブル84の位置を検出するテーブル位置検出器85をさらに備える。テーブル位置検出器85の具体例としては、リニアエンコーダが挙げられる。テーブル位置検出器85は、検出したテーブルの位置をフィードバック位置Xfbとしてサーボ制御部6に入力することができる。
【0027】
以上説明した機械装置3の構成は一例であり、機械装置3の構成はかかる例に限定されない。後述するように、本実施の形態の補正パラメータ調整装置1は、複数の機械装置3を制御対象とすることが可能である。
【0028】
図5の説明に戻る。モータ位置検出器4は、モータ2に取り付けられており、モータ2の回転方向の位置を検出する。モータ位置検出器4の具体例としては、ロータリエンコーダが挙げられる。モータ位置検出器4は、検出したモータ2の位置をフィードバック位置Xfbとしてサーボ制御部6に入力することができる。フィードバック位置Xfbは、テーブル位置検出器85が検出したテーブル位置およびモータ位置検出器4が検出したモータ2の位置のうち少なくとも1つである。
【0029】
なお、テーブル位置検出器85は、テーブル84の移動距離を測定することができるのに対して、モータ位置検出器4において直接検出される位置は、モータ2の回転角度である。しかしながら、検出された回転角度にモータ2の1回転あたりのテーブル移動距離であるボールねじリードを乗じて、モータ1回転の角度2π(rad)で除することによって、サーボ制御部6は、モータ2の回転角度をテーブル84の移動方向の長さに換算することができる。このため、モータ位置検出器4またはテーブル位置検出器85を省略することも可能である。図5では、モータ駆動装置99がモータ位置検出器4を備え、モータ位置をフィードバック位置Xfbとしてサーボ制御部6に入力する例を示している。一方、図6では、機械装置3がテーブル位置検出器85を備える例を示している。
【0030】
フィードバック位置Xfbとして、モータ位置検出器4により検出された結果を用いるフィードバック制御をセミクローズドループ制御と呼ぶ。フィードバック位置Xfbとして、モータ位置検出器4により検出された結果とテーブル位置検出器85により検出された結果との両方、または、テーブル位置検出器85により検出された結果のみを使用するフィードバック制御を、フルクローズドループ制御と呼ぶ。
【0031】
指令値生成部5は、運転プログラムXcに基づいてモータ2の位置指令Xrを生成し、生成した位置指令Xrをサーボ制御部6に入力する。ここでは、運転プログラムXcは、機械装置3の制御対象の指令位置と指令速度とがGコードで記述された数値制御用のNC(Numerical Control)プログラムである。サーボ制御部6への位置指令Xrは、運転プログラムXcに加減速処理およびフィルタリング処理を行って生成した時系列の位置指令とする。ここでGコードとは、数値制御で用いられる命令コードの1つであり、制御対象物の位置決め、直線補間、円弧補間、平面指定などを行う際に記述される指令コードである。
【0032】
サーボ制御部6は、指令値生成部5から入力される位置指令Xrと、制御対象の位置を示す情報であるフィードバック位置Xfbと、補正量演算部7から入力される補正量Dcmpとに基づいて、フィードバック制御を行ってモータ2を駆動するためのモータ電流Imを生成し、生成したモータ電流Imをモータ2へ入力する。
【0033】
補正量演算部7は、補正機能毎に、駆動データDcおよび補正パラメータPcに基づいて、位置補正量、速度補正量、電流補正量の3つの状態量から構成される補正量Dcmpをサーボ制御部6に出力する。個々で、補正パラメータPcおよび駆動データDcは、複数の状態量からなるベクトルまたは行列である。例えば、摩擦補正機能であれば、補正量演算部7は、運動方向反転位置からの変位量、速度の状態量、位置補正パラメータ、および速度補正パラメータを用いて、電流補正量を算出する。
【0034】
図7は、図5に示すサーボ制御部6の構成を示す図である。サーボ制御部6は、微分演算器31と、位置制御器32と、速度制御器33と、電流制御器34と、駆動データ送信部35とを有する。
【0035】
微分演算器31は、フィードバック位置Xfbの微分演算を行って、フィードバック速度を算出する。微分演算器31は、算出したフィードバック速度を速度制御器33に入力する。
【0036】
位置制御器32は、モータ位置検出器4から入力されるフィードバック位置Xfbと、指令値生成部5から入力される位置指令Xrと、補正量演算部7から入力される補正量Dcmpに含まれる位置補正量とに基づいて、速度指令を生成する。具体的には、位置制御器32は、位置指令とフィードバック位置Xfbとの差である位置偏差を小さくするように、比例制御などの位置制御処理を実行し、位置補正量に基づいて補正処理を行って速度指令を生成する。位置制御器32は、生成した速度指令を速度制御器33に入力する。
【0037】
速度制御器33は、微分演算器31から入力されるフィードバック速度と、位置制御器32から入力される速度指令と、補正量演算部7から入力される補正量Dcmpに含まれる速度補正量とに基づいて、電流指令Irを生成する。具体的には、速度制御器33は、速度偏差を小さくするように、比例積分制御などの速度制御処理を実行し、速度補正量に基づいて補正処理を行って電流指令Irを生成する。速度制御器33は、生成した電流指令Irを電流制御器34に入力する。
【0038】
電流制御器34は、速度制御器33から入力される電流指令Irと、補正量演算部7から入力される補正量Dcmpに含まれる電流補正量とに基づき、モータ電流Imを生成する。具体的には、電流制御器34は、出力するモータ電流Imが入力された電流指令Irに一致するように、比例積分制御などの電流制御を行う。電流制御器34は、生成したモータ電流Imをモータ2に入力する。
【0039】
駆動データ送信部35は、サーボ制御部6における各指令値、フィードバック値、補正量などを収集し、駆動データとして出力する。駆動データ送信部35が出力した駆動データは、補正量演算部7および補正パラメータ調整装置1の駆動データ取得部13に入力される。
【0040】
なお、図7では、セミクローズドループ制御を行う例について説明したが、フルクローズドループ制御を行う場合には、フィードバック位置Xfbのうちモータ位置検出器4の検出値は微分演算器31に入力され、フィードバック位置Xfbのうちテーブル位置検出器85の検出値は、位置制御器32に入力される。
【0041】
続いて、本実施の形態のハードウェア構成について説明する。図8は、図1に示す補正パラメータ調整装置1のハードウェア構成例を示す図である。補正パラメータ調整装置1は、演算装置41と、メモリ42と、記憶装置43と、通信装置44と、入力装置45と、表示装置46とを有する。
【0042】
演算装置41は、演算処理を行うCPU(Central Processing Unit)をはじめとしたプロセッサである。メモリ42は、演算装置41が演算処理の途中で使用するデータを格納するワークエリアとして機能する。記憶装置43は、コンピュータプログラム、情報などを記憶する。通信装置44は、補正パラメータ調整装置1の外部との通信機能を有する。入力装置45は、操作者からの入力を受け付ける。入力装置45は、キーボード、マウスなどである。表示装置46は、表示画面を出力する。表示装置46は、モニタ、ディスプレイなどである。なお、入力装置45と表示装置46とが一体化されたタッチパネルが用いられてもよい。
【0043】
図1に示す調整要件入力部11、補正機能選択部12、駆動データ取得部13、特徴量抽出部14、補正パラメータ決定部15および機械学習装置100の機能は、演算装置41が記憶装置43に格納されたコンピュータプログラムを読み出して実行することにより実現される。また、演算装置41によって調整要件入力部11および補正機能選択部12が実現される際には、入力装置45および表示装置46が用いられる。また、演算装置41によって補正機能選択部12および補正パラメータ決定部15が実現される際には、通信装置44が用いられてもよい。
【0044】
また、補正機能情報記憶部16は、図1では補正パラメータ調整装置1の外部に設けられている。この場合、補正機能情報記憶部16は、補正パラメータ調整装置1とネットワークを介して接続されたサーバ、またはクラウド上のサーバなどによって実現される。また、補正機能情報記憶部16は、補正パラメータ調整装置1の内部に設けられてもよい。この場合、補正機能情報記憶部16は、記憶装置43によって実現される。補正パラメータ調整装置1および機械学習装置100は、その機能の全てまたは一部が隔離された場所に設けられていてもよい。その場合、機械学習装置100は、ネットワークを介してモータ駆動装置99に接続される。
【0045】
図9は、図1に示す補正パラメータ調整装置1の動作を示すフローチャートである。まず、調整要件入力部11は、操作者が入力装置45を用いて行う調整要件の入力を受け付ける(ステップS101)。例えば、調整要件は、目標精度、目標タクトタイムなどである。補正機能選択部12は、調整要件入力部11が受け付けた調整要件に従って、調整対象の補正機能を選択する(ステップS102)。
【0046】
続いて、補正パラメータ決定部15は、設定された補正パラメータを使用して、モータ駆動装置99にモータ2を駆動させる(ステップS103)。ここで、ステップS103の動作を1回目に行う際には、設定される補正パラメータは、予め定められた初期設定値、例えばゼロ、前回の調整処理において決定された補正パラメータの値などである。また、2回目以降は、後述するステップS107において設定された補正パラメータが使用される。駆動データ取得部13は、モータ2を駆動中の駆動データをモータ駆動装置99から取得する(ステップS104)。特徴量抽出部14は、補正機能ごとに特徴量を抽出する(ステップS105)。
【0047】
機械学習装置100は、発生する誤差を抑制することが可能な補正パラメータを学習する(ステップS106)。補正パラメータ決定部15は、機械学習装置100の学習結果Frに基づいて、補正パラメータを決定し、決定した補正パラメータをモータ駆動装置99に設定する(ステップS107)。補正パラメータ決定部15は、検証用駆動データDvを用いて補正パラメータを評価し、調整要件を満たすか否かを判断する(ステップS108)。調整要件を満たす場合(ステップS108:Yes)、補正パラメータ調整装置1は、補正パラメータの調整処理を終了する。調整要件を満たさない場合(ステップS108:No)、補正パラメータ調整装置1は、ステップS103から補正パラメータの調整処理を繰り返す。
【0048】
ここで、機械学習装置100が強化学習を用いる場合の構成について説明する。強化学習は、ある環境内における行動主体であるエージェントが、現在の状態を観測し、取るべき行動を決定する学習方法である。エージェントは、行動を選択することで環境から報酬を得て、一連の行動を通じて報酬が最も多く得られるような方策を学習する。強化学習の代表的な手法として、Q学習、TD学習などが知られている。Q学習の場合、行動価値関数Q(s,a)の一般的な更新式である行動価値テーブルは、以下の数式(1)で表される。
【0049】
【数1】

【0050】
数式(1)において、stは時刻tにおける環境を表し、atは時刻tにおける行動を表す。行動atにより、環境はst+1に変わる。rt+1は、その環境の変化によってもらえる報酬を表す。γは、割引率を表す。αは、学習係数を表す。Q学習を適用した場合、環境stが状態変数となり、行動atが補正パラメータとなる。
【0051】
数式(1)で表される更新式は、時刻t+1における最良の行動aの行動価値が、時刻tにおいて実行された行動aの行動価値関数Qよりも大きければ、行動価値関数Qを大きくし、逆の場合には、行動価値関数Qを小さくする。換言すれば、時刻tにおける行動aの行動価値関数Qを、時刻t+1における最良の行動価値に近づけるように、行動価値関数Q(s,a)を更新する。これにより、ある環境における最良の行動価値が、それ以前の環境における行動価値に順次伝搬していくようになる。
【0052】
図10は、機械学習装置100が強化学習を用いる場合の図3に示す学習部102の構成を示す図である。学習部102は、報酬計算部102aと、関数更新部102bとを有する。
【0053】
報酬計算部102aは、状態観測部101により観測された状態変数に基づいて報酬を計算する。報酬計算部102aは、補正機能ごとに、報酬を計算する。報酬計算部102aは、補正機能ごとに、補正機能が対象とする誤差を示す特徴量を用いて、報酬増大基準を満たす場合には、報酬rを増大させて、例えば「1」の報酬を与える。報酬計算部102aは、報酬減少基準を満たす場合には、報酬rを低減して、例えば「−1」の報酬を与える。報酬増大基準は、例えば誤差が閾値よりも小さいことであり、報酬減少基準は、例えば誤差が閾値よりも大きいことである。誤差は、例えば位置の誤差であり、位置の誤差は、位置指令または誤差が存在しない場合の理想的なモータ位置と位置フィードバックとの差分により計算することができる。また、誤差は、速度または電流の誤差であってもよい。
【0054】
関数更新部102bは、報酬計算部102aによって計算される報酬に従って、補正パラメータを決定するための関数を更新する。Q学習の場合、数式(1)で表される行動価値関数Q(st,at)を補正パラメータを変更するための関数として用いる。
【0055】
図11は、図3に示す機械学習装置100が強化学習を使用する場合の学習部102の動作を示す図である。なお、図11に示す動作は、図9に示すステップS105に相当する。
【0056】
報酬計算部102aは、特徴量に基づいて、報酬増大基準を満たすか否かを判断する(ステップS201)。報酬増大基準を満たす場合(ステップS201:Yes)、報酬計算部102aは、報酬を増大させる(ステップS202)。報酬増大基準を満たさない場合(ステップS201:No)、報酬計算部102aは、報酬を減少させる(ステップS203)。
【0057】
報酬計算部102aが報酬を計算すると、関数更新部102bは、計算された報酬に基づいて、行動価値関数を更新する(ステップS204)。ステップS201からステップS204に示す動作は、図9のステップS107において、調整要件が満たされるまで、繰り返して実行される。ステップS201〜ステップS204の動作によって、行動価値関数が更新されると、図9のステップS106では、このときの行動価値関数に基づいて補正パラメータが設定される。調整要件が満たされると、以降はそのときの行動価値関数に基づいて設定された補正パラメータが使用されることになる。
【0058】
以上、強化学習を使用して機械学習を行う例について説明したが、他の公知の方法、例えば、ニューラルネットワーク、遺伝的プログラミング、機能論理プログラミング、サポートベクターマシンなどに従って機械学習を行ってもよい。
【0059】
以上説明したように、本発明の実施の形態1にかかる補正パラメータ調整装置1によれば、複数の補正機能毎に補正対象の現象を反映した駆動データを特徴量として抽出し、特徴量毎に補正パラメータを学習する。このように特徴量毎、つまり補正機能毎に補正パラメータを学習する構成により、複数の種類の補正機能を有するモータ駆動装置であっても、モータ駆動装置の指令値の補正条件を決定するための補正パラメータを容易に調整することが可能になる。また、補正パラメータを学習することで、指令値自体または補正量自体を学習する場合と比較して、少ないメモリで効果的な補正を実現することが可能となる。
【0060】
実施の形態2.
図12は、本発明の実施の形態2にかかる補正パラメータ調整装置1aの構成を示す図である。補正パラメータ調整装置1aは、調整要件入力部11と、補正機能選択部12と、駆動データ取得部13aと、特徴量抽出部14と、補正パラメータ決定部15と、機械学習装置100とを有する。
【0061】
実施の形態2にかかる補正パラメータ調整装置1aは、実施の形態1にかかる補正パラメータ調整装置1の駆動データ取得部13の代わりに駆動データ取得部13aを有する点以外は補正パラメータ調整装置1と同様であるため、以下、実施の形態1と異なる点について主に説明する。補正パラメータ調整装置1aの調整対象であるモータ駆動装置99には、センサ21が設けられる。駆動データ取得部13aは、モータ駆動装置99の制御信号である駆動データに加えて、センサ21の検出信号を駆動データとして取得する。
【0062】
センサ21は、加速度センサ、温度センサ、変位センサなどである。モータ駆動装置99には、1種類のセンサ21が取り付けられてもよいし、複数の種類のセンサ21が取り付けられてもよい。
【0063】
例えば、センサ21として加速度センサを用いる場合、機械装置3のテーブル84に取り付けると、モータ駆動装置99の制御信号では取得することができない機械装置3のテーブル84の振動に関する特徴量を抽出して、状態変数として用いることが可能になる。加速度センサの信号を積分すると、テーブル84の運動軌跡を推定することができ、テーブル84の運動軌跡を特徴量として抽出して、状態変数として用いることが可能になる。加速度センサをテーブル84に取り付けることで、例えば、機械先端における摩擦補正機能の効果を高めることができる補正パラメータを調整することが可能になる。さらに、加工中の加速度と非加工中の加速度とをそれぞれ抽出することで、加工外乱を抑制する補正機能の補正パラメータを調整することが可能になる。
【0064】
さらに、センサ21として、加速度センサ、温度センサおよび変位センサを用いる場合には、熱変位に関する補正機能の補正パラメータを高精度に調整するとが可能になる。以上説明したように、センサ21の検出信号を用いることで、モータ駆動装置99の制御信号である駆動データだけでは取得することができない情報を得ることができ、補正パラメータの調整精度を向上させることが可能になる。
【0065】
実施の形態3.
図13は、本発明の実施の形態3にかかる補正パラメータ調整装置1bの構成を示す図である。補正パラメータ調整装置1bは、調整要件入力部11と、補正機能選択部12と、駆動データ取得部13bと、特徴量抽出部14と、補正パラメータ決定部15bとを有する。
【0066】
補正パラメータ調整装置1bは、補正パラメータ調整装置1aの駆動データ取得部13aの代わりに駆動データ取得部13bを有し、補正パラメータ決定部15の代わりに補正パラメータ決定部15bを有する。以下、補正パラメータ調整装置1aと異なる部分について主に説明する。
【0067】
駆動データ取得部13bは、駆動データ取得部13aと同様に、モータ駆動装置99の制御信号だけでなく、センサ21の検出信号を駆動データとして取得する。また、駆動データ取得部13bは、学習用駆動データDeを特徴量抽出部14に入力し、検証用駆動データDvを補正パラメータ決定部15bに入力しない。
【0068】
補正パラメータ決定部15bは、調整要件入力部11から入力される調整要件と、機械学習装置100から入力される学習結果Frおよび補正パラメータ情報とに基づいて、補正パラメータを決定すると共に、補正パラメータの調整処理を終了するか否かを判断する。
【0069】
図14は、図13に示す補正パラメータ決定部15bの構成を示す図である。補正パラメータ決定部15bは、補正パラメータ計算部51bと、シミュレーション部54と、補正パラメータ評価部52bと、終了判定部53bとを有する。
【0070】
補正パラメータ計算部51bは、機械学習装置100から入力される学習結果Frと、補正パラメータ情報とに基づいて、補正機能毎に、学習結果Frを近似する補正パラメータを計算する。補正パラメータ計算部51bは、計算した補正パラメータをシミュレーション部54と、終了判定部53bとに入力する。
【0071】
シミュレーション部54は、補正パラメータ計算部51bから入力される補正パラメータを用いて、駆動シミュレーションを実行する。シミュレーション部54は、シミュレーション結果を補正パラメータ評価部52bに入力する。
【0072】
補正パラメータ評価部52bは、シミュレーション部54から入力されるシミュレーション結果に含まれる駆動データを評価し、評価結果を終了判定部53bに入力する。終了判定部53bは、調整要件と評価結果とを比較して、補正パラメータの調整処理を終了するか否かを判断する。
【0073】
以上説明したように、本発明の実施の形態3にかかる補正パラメータ調整装置1bは、補正パラメータ決定部15bが、補正パラメータを用いて駆動シミュレーションを実行するシミュレーション部54を有するため、実際にモータ駆動装置99を駆動せずに補正パラメータの検証を行うことが可能になる。このため、補正パラメータの調整に要する時間を短縮することが可能になる。
【0074】
以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
【符号の説明】
【0075】
1,1a,1b 補正パラメータ調整装置、2 モータ、3 機械装置、4 モータ位置検出器、5 指令値生成部、6 サーボ制御部、7 補正量演算部、11 調整要件入力部、12 補正機能選択部、13,13a,13b 駆動データ取得部、14 特徴量抽出部、15,15b 補正パラメータ決定部、16 補正機能情報記憶部、21 センサ、31 微分演算器、32 位置制御器、33 速度制御器、34 電流制御器、35 駆動データ送信部、41 演算装置、42 メモリ、43 記憶装置、44 通信装置、45 入力装置、46 表示装置、51,51b 補正パラメータ計算部、52,52b 補正パラメータ評価部、53,53b 終了判定部、54 シミュレーション部、61 アルゴリズム選択部、62 アルゴリズム記憶部、63 特徴量計算部、82 ボールねじ、84 テーブル、85 テーブル位置検出器、86a,86b 案内機構、87a ボールフロントベアリング、87b リアベアリング、88 リジッドカプリング、89 ベッド、99 モータ駆動装置、100 機械学習装置、101 状態観測部、102 学習部、102a 報酬計算部、102b 関数更新部。
(57)【特許請求の範囲】
【請求項1】
複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習装置であって、
前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、前記補正パラメータとを状態変数として観測する状態観測部と、
前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習する学習部と、
を備えることを特徴とする機械学習装置。
【請求項2】
前記駆動データは、前記モータ駆動装置を駆動するモータからのフィードバックデータ、および、前記モータの制御対象である機械装置の駆動データのうち少なくとも1つを含むことを特徴とする請求項1に記載の機械学習装置。
【請求項3】
前記特徴量は、複数次元のベクトル量であり、前記補正機能毎の前記駆動データの特性を示すデータであることを特徴とする請求項1または2に記載の機械学習装置。
【請求項4】
前記学習部は、
前記状態変数に基づいて報酬を計算する報酬計算部と、
前記報酬に基づいて、前記補正パラメータを決定するための関数を更新する関数更新部と、
を有することを特徴とする請求項1から3のいずれか1項に記載の機械学習装置。
【請求項5】
前記関数更新部は、前記補正機能毎に前記関数を更新することを特徴とする請求項4に記載の機械学習装置。
【請求項6】
請求項1から5のいずれか1項に記載の機械学習装置と、
前記複数の種類の補正機能のうちの1つを選択する補正機能選択部と、
前記駆動データを取得する駆動データ取得部と、
選択された前記補正機能と、取得された前記駆動データとに基づき、前記特徴量を抽出する特徴量抽出部と、
前記補正パラメータの調整要件を入力する調整要件入力部と、
前記学習部の学習結果に基づいて、前記調整要件を満たす前記補正パラメータを決定する補正パラメータ決定部と、
を備えることを特徴とする補正パラメータ調整装置。
【請求項7】
前記駆動データは、前記モータ駆動装置を駆動するモータからのフィードバックデータ、および、前記モータの制御対象である機械装置の駆動データのうち少なくとも1つを含むことを特徴とする請求項6に記載の補正パラメータ調整装置。
【請求項8】
前記機械装置の駆動データは、前記機械装置に設置したセンサから取得した検出データであることを特徴とする請求項7に記載の補正パラメータ調整装置。
【請求項9】
前記補正パラメータ決定部は、
前記学習結果に基づいて補正パラメータを計算し、計算した前記補正パラメータを前記モータ駆動装置に送信する補正パラメータ計算部と、
計算した前記補正パラメータによる駆動結果が前記調整要件を満たすか否かを評価する補正パラメータ評価部と、
前記補正パラメータ評価部の評価結果に基づいて、前記補正パラメータの調整を終了するか否かを判定する終了判定部と、
を備えることを特徴とする請求項6から8のいずれか1項に記載の補正パラメータ調整装置。
【請求項10】
前記補正パラメータ評価部は、実際に前記モータ駆動装置を駆動したときに取得される駆動データ、および、前記モータ駆動装置の動きをシミュレーションしたときに取得される駆動データの少なくとも1つを用いて評価を行うことを特徴とする請求項9に記載の補正パラメータ調整装置。
【請求項11】
複数の種類の補正機能を有するモータ駆動装置においてモータを制御するための指令値の補正に用いられる補正パラメータを学習する機械学習方法であって、
機械学習装置が、前記補正機能の種類に基づいて、前記モータ駆動装置の駆動データから計算により切り取られ抽出された特徴量と、前記補正パラメータとを状態変数として観測するステップと、
前記機械学習装置が、前記状態変数に基づいて前記補正機能毎に作成される訓練データセットに従って、前記訓練データセットに含まれる前記状態変数を用いて前記補正パラメータを前記補正機能毎に学習するステップと、
を含むことを特徴とする機械学習方法。
 
訂正の要旨 審決(決定)の【理由】欄参照。
異議決定日 2022-10-06 
出願番号 P2018-564994
審決分類 P 1 651・ 121- YAA (G05D)
P 1 651・ 537- YAA (G05D)
P 1 651・ 851- YAA (G05D)
P 1 651・ 161- YAA (G05D)
P 1 651・ 536- YAA (G05D)
P 1 651・ 853- YAA (G05D)
最終処分 07   維持
特許庁審判長 刈間 宏信
特許庁審判官 大山 健
見目 省二
登録日 2019-08-09 
登録番号 6567205
権利者 三菱電機株式会社
発明の名称 機械学習装置、補正パラメータ調整装置および機械学習方法  
代理人 高村 順  
代理人 高村 順  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ