Amazon Bedrock AgentCore Evaluations
スライド
サマリ
Amazon Bedrock AgentCore Evaluations is now generally available
カテゴリ: What's New 公開日: 2026-03-31T16:00:00 元記事: https://aws.amazon.com/about-aws/whats-new/2026/03/agentcore-evaluations-generally-available/
要約
Amazon Bedrock AgentCore Evaluationsが一般提供開始となり、開発者はオンライン評価とオンデマンド評価を通じて、AIエージェントの品質を継続的に監視・テストできるようになりました。本機能は、13個の組み込み評価器、Ground Truth、カスタム評価器により、エージェントのパフォーマンス測定と品質保証を実現するため、本番環境でのエージェント運用を重視する組織に特に有用です。
詳細
新機能について
Amazon Bedrock AgentCore Evaluationsが一般提供開始となり、AI エージェントの自動品質評価機能が利用可能になりました。
オンライン評価により、本番環境のエージェントパフォーマンスを継続的に監視し、ライブトレースをサンプリングしてスコアリングすることができます。
オンデマンド評価により、プログラマティックにエージェントをテストでき、CI/CDパイプラインでの回帰テストと対話的な開発ワークフローに対応しています。
13個の組み込み評価器により、応答品質、安全性、タスク完了、ツール使用状況を評価できます。
Ground Truthを使用して、参照回答、行動アサーション、期待されるツール実行シーケンスに基づいてエージェントパフォーマンスを測定できます。
カスタム評価器により、LLMベースの評価またはLambda関数を使用したコードベースの評価を実装できます。
AgentCore Observabilityと統合され、統一的な監視とリアルタイムアラートが提供されます。
9つのAWSリージョンで利用可能です。
対象ユーザーについて
AI エージェントを開発・運用するデベロッパーやエンジニアに適しています。
本番環境でのエージェント品質を継続的に監視したいチームに有用です。
CI/CDパイプラインに回帰テストを組み込みたい組織に最適です。
ドメイン固有の要件に対応した評価が必要な企業に適しています。