[編集発行] (公財)つくば科学万博記念財団 [協力] 科学技術振興機構(JST)・文科省研究交流センター

つくばサイエンスニュース

トピックスつくばサイエンスニュース

AIが保持する知識を選択的に忘却できる新技術を創出―安全で使いやすく信頼性の高いAIモデルの実現に貢献:東京理科大学/産業技術総合研究所

(2025年12月2日発表)

 東京理科大学と(国)産業技術総合研究所の共同研究グループは12月2日、AI(人工知能)が学習済みの知識をドメイン単位で忘却可能とする世界初の新技術を提案・創出したと発表した。不要な知識による誤認を防ぐことができ、AIの信頼性向上が期待されるという。

 事前学習済み大規模VLM(視覚言語モデル)と呼ばれるAIが、近年さまざまな用途で優れた性能を発揮している。このVLMの登場でAIは追加学習を行わなくても多様な物体を高精度に認識できるようになり、AIの応用範囲は大きく拡大した。

 半面、必要以上の知識を保持することによる副作用も指摘されている。不要な知識を保持することは誤認識や処理の非効率化を招き、システム全体の信頼性を損なう恐れがある。

 こうした課題に対処するため、学習済みモデルから不要な知識のみを選択的に忘却させる「近似アンラーニング」という技術が注目され、認識対象のカテゴリーにあたるクラス単位の忘却が実現されてきた。

 しかし、実際の応用では同じ物体であっても、写真、絵画、クリップアート、スケッチといったドメイン(表現形式)の違いによって意味が異なることがあるにもかかわらず VLMはその汎化能力ゆえにそれらを区別せず一律に同じ物体として認識してしまうので、特定のドメインの知識だけを残し、それ以外を忘却する必要がある。

 研究グループは今回、従来のクラス単位でのアンラーニング技術よりも詳細かつ柔軟な忘却を実現できる「近似ドメインアンラーニング」という新たな近似アンラーニング技術を世界に先駆けて創出した。

 標準的な画像認識テストデータを用いて性能を評価したところ、クラス単位での近似アンラーニング技術をそのままドメイン単位での近似アンラーニングに適用した場合に対して、平均で約1.6倍の性能向上が確認された。特に、最も難易度の高い条件下では約1.7倍の性能改善が見られ、新手法の有効性が実証されたという。

 今回の成果は、AIが保持する知識を目的に応じて柔軟に制御できる新たな設計原理を提示するもので、安全で信頼性の高いAI活用への道が拓けたとしている。