
IPA、AIセーフティ向上のためレッドチーミング手法ガイドを改訂
ポイント
情報処理推進機構(IPA)傘下のAIセーフティ・インスティテュート(AISI)は、AIシステムの安全性評価手法であるレッドチーミングに関するガイドを改訂し、具体的な実施例を追加した。AI開発者や提供者が攻撃者視点での評価を行いやすくなる。 独立行政法人情報処理推進機構(IPA)内のAIセーフティ・インスティテュート(AISI)は、2025年4月2日、AIシステムの安全性評価手法であるレッドチーミングに関する手法ガイドを改訂した。今回の改訂では、具体的な実施例を通じて、レッドチーミングの手順を詳細に解説している。
レッドチーミングとは、AIシステムに対して攻撃者の視点から脆弱性を評価し、潜在的なリスクを洗い出す手法である。AISIは、2024年9月に初版のガイドを公開していたが、高度な専門性が求められるため、より実践的な内容への改訂を検討してきた。
今回の改訂版では、RAG(Retrieval-Augmented Generation)の仕組みを実装したAIシステムに対して実際にレッドチーミングを行い、その手順を詳細に解説している。具体的には、リスクシナリオや攻撃シナリオの作成、攻撃シナリオの実施結果、レッドチーミング実施結果報告書、最終報告書などの成果物例を示している。これにより、AI開発者や提供者が攻撃者の視点でシステムの弱点や対策の不備を発見し、修正・強化する際の参考になることが期待されるという。
AISIは、AIシステムの悪用や誤用、不正確な出力によるリスクが高まる中、AIセーフティへの関心が国内外で高まっていると指摘している。今回のガイド改訂は、そうした状況に対応し、AIシステムの安全性向上を支援するための取り組みの一環である。
改訂版のガイドは、日本語版および英語版がAISIのウェブサイトからダウンロード可能となっている。AIシステムの開発や提供に携わる企業や技術者にとって、有益な資料となりそうだ。
添付画像一覧

×