人工知能との比較で、学習のコツを掴む脳のメカニズムを解明

人工知能との比較で、学習のコツを掴む脳のメカニズムを解明―スポーツ技能の上達や運動機能の回復訓練にも役立つ：筑波大学

(2023年７月８日発表)

　筑波大学システム情報系の井澤淳（いざわじゅん）准教授の研究チームは７月８日、人工知能(AI)と人間のメタ認知システムとの違いを比較、分析することで、学習能力を客観的に把握し、制御することに成功したと発表した。スポーツ技能の上達や、失った体の運動機能の回復訓練にも応用できるとみている。

　トップアスリートが新しい運動を学ぶ際の能力は選手の生まれつきの才能で、後天的な訓練ではそれほど改善しないと思われていた。しかし運動学習能力は、「環境の変動」や「金銭的報酬」によっても多様に変わることが明らかになってきた。例えばトレーニングでは初日より２日目の方が学習速度が速くなる。だがこの現象の背景にある脳の働きは未解明だった。

　研究チームは、運動の学習能力の変化はメタ認知によって積極的に調整されていると考えた。

　メタ認知とは、自分自身の学習能力を客観的に認知する能力をいう。勉強ができるようになるコツは、学習能力を客観的に監視・制御することによってなされるが、それを実験で調べる方法がなかった。

　そこで人工知能のメタ認知メカニズムと、人の脳内の活動を比較することで解明できるとの仮説をたてた。人工知能は報酬を最大化するように、上位の強化学習システムが下位の学習システムを監視、制御し、学習パラメーター（変数）を変えることで、「学習の学習」をしていることが知られている。

　人工知能のメタ認知システムを、人の学習の「スピード」と「記憶の保持時間」の関係に当てはめることでメタ認知の理論を導いた。

　これを仮想現実装置（VR）による運動学習実験によって検証した。VR装置には特殊な工夫を施し、「本当の手の位置」からズレた所に「手先の位置」を表示した。手先の位置の動き（運動機能）と、観測する手先の動きにズレが生じると、人はこのズレを修正し、目的に合わせるように手の運動機能を動かす。

　実験では、参加者が調整のために動かした「運動機能」を推定し、記憶に伴って報酬（お金など）を与えた。記憶の更新量が大きい場合に報酬金額を増やすと、学習が進んだ。逆に記憶の更新量が小さい場合には、お金を増やす操作をすると学習は抑えられた。

　「学習の学習」訓練によって、人の運動学習能力を任意に増やしたり、減らしたりすることを実験的に示したのは世界で初めての成果となった。

　この結果は、記憶と学習能力を客観的に観測したうえで、報酬（金銭）に基づいて軌道を修正する機構（フィードバック）を人の脳が備えていることを示している。

　さらにゼロから得点を増やす「報酬」型か、それとも最大値から減らす「罰」型かによって、学習能力の変化が全く異なった。「罰」型は、罰が少なくなるように学習スピードを加速・減速し、「報酬」型は報酬が増加するように記憶を忘れやすくしたり、忘れにくくしたりの調整をしていた。

　人工知能が、報酬情報と罰情報が同じようなメタ認知能力を発揮しているのに対し、人の場合のメタ認知は「報酬」と「罰」とで対応が違うことが分かり、脳内機能を解明する重要なヒントになった。

　運動学習を監視し、制御する機能は、運動の記憶や誤差、報酬情報のような要素として分解できる。要素間の相互作用も明確に定義することが可能だ。

　つまり運動技能の「学習の学習」はメタ認知の最小単位である。これを理論化し行動実験を確立し、脳内メカニズムを明らかにすることによって、人の意識機能の本質を解明できるとみている。

詳しくはこちら