Amazon Bedrock AgentCore Evaluations - AWS What's New Slides

Amazon Bedrock AgentCore Evaluations

本ページの内容はAIが作成しているため、ハルシネーションに注意してご自身で詳細はご確認ください。

スライド

スライドを読み込み中...

サマリ

Amazon Bedrock AgentCore Evaluations is now generally available

カテゴリ: What's New 公開日: 2026-03-31T16:00:00 元記事: https://aws.amazon.com/about-aws/whats-new/2026/03/agentcore-evaluations-generally-available/


要約

Amazon Bedrock AgentCore Evaluationsが一般提供開始となり、開発者はオンライン評価とオンデマンド評価を通じて、AIエージェントの品質を継続的に監視・テストできるようになりました。本機能は、13個の組み込み評価器、Ground Truth、カスタム評価器により、エージェントのパフォーマンス測定と品質保証を実現するため、本番環境でのエージェント運用を重視する組織に特に有用です。

詳細

新機能について

  • Amazon Bedrock AgentCore Evaluationsが一般提供開始となり、AI エージェントの自動品質評価機能が利用可能になりました。

  • オンライン評価により、本番環境のエージェントパフォーマンスを継続的に監視し、ライブトレースをサンプリングしてスコアリングすることができます。

  • オンデマンド評価により、プログラマティックにエージェントをテストでき、CI/CDパイプラインでの回帰テストと対話的な開発ワークフローに対応しています。

  • 13個の組み込み評価器により、応答品質、安全性、タスク完了、ツール使用状況を評価できます。

  • Ground Truthを使用して、参照回答、行動アサーション、期待されるツール実行シーケンスに基づいてエージェントパフォーマンスを測定できます。

  • カスタム評価器により、LLMベースの評価またはLambda関数を使用したコードベースの評価を実装できます。

  • AgentCore Observabilityと統合され、統一的な監視とリアルタイムアラートが提供されます。

  • 9つのAWSリージョンで利用可能です。

対象ユーザーについて

  • AI エージェントを開発・運用するデベロッパーやエンジニアに適しています。

  • 本番環境でのエージェント品質を継続的に監視したいチームに有用です。

  • CI/CDパイプラインに回帰テストを組み込みたい組織に最適です。

  • ドメイン固有の要件に対応した評価が必要な企業に適しています。