Amazon Bedrock Guardrailsがエージェンティック AI ワークフロー向け新APIを発表
本ページの内容はAIが作成しているため、ハルシネーションに注意してご自身で詳細はご確認ください。
スライド
スライドを読み込み中...
サマリ
Amazon Bedrock Guardrailsがエージェンティック AI ワークフロー向け新APIを発表
Amazon Bedrock Guardrails announces a new API targeting agentic AI workflows
カテゴリ: What's New 公開日: 2026-06-16 元記事: AWS What's New
要約
Amazon Bedrock Guardrailsの新しいInvokeGuardrailChecks APIは、ガードレールリソースを作成することなく、エージェンティックAIアプリケーションの各ステップで個別のセーフガードを柔軟に適用できるリソースレスAPIです。このアップデートは、複数のステップで異なるリスクプロファイルに対応し、コンテンツフィルタ、プロンプト攻撃検出、機密情報フィルタなどのセーフガードをカスタマイズして実装する必要があるユーザーに特に適しています。
主な変更点
InvokeGuardrailChecks API の発表
- 新しいリソースレスAPI: ガードレール リソースを作成することなく、エージェンティック AI アプリケーションの任意のポイントで個別のセーフガードを適用可能
- ステップごとの柔軟な構成: エージェンティック AI ループの各ステップで異なるリスク プロファイルに対応
- リクエストごとの制御: APIはリクエストごとにどのセーフガードを実行するかを指定でき、ガードレールID の追跡やバージョン管理が不要
対応するセーフガード
1. コンテンツフィルタ
- ヘイト、暴力、性的、侮辱、不正行為を含む有害コンテンツを検出
2. プロンプト攻撃検出
- ジェイルブレイク: 不正なシステム プロンプト操作を検出
- プロンプトインジェクション: ユーザー入力への悪意あるプロンプトインジェクションを検出
- プロンプトリーク: プロンプトの漏洩を検出
- 重要: 各チェックは独立したセーフガードとして実装され、個別に呼び出し可能
3. 機密情報フィルタ
- サポートされている PII (個人識別情報) エンティティタイプを検出
カスタマイズ可能なアクション
- 数値の重大度スコアと信頼度スコアを返却
- カスタムしきい値を設定可能
- 以下のアクションをカスタマイズ実装可能:
- ブロック: 違反を検出した場合にリクエストを拒否
- パス: 検出されても処理を続行
- 再試行: ユーザーに修正を促す
- ログ記録: セキュリティ監視ログに記録
利用可能なリージョン
一般提供 (GA) リージョン
米国
- US East (N. Virginia)
- US East (Ohio)
- US West (Oregon)
ヨーロッパ
- Europe (London)
- Europe (Stockholm)
アジアパシフィック
- Asia Pacific (Tokyo)
- Asia Pacific (Sydney)
設計上の特徴
1. Detect-Only モード
- セーフガード違反を検出するのみで、自動ブロックは行わない
- 開発者がカスタムロジックで対応方法を決定
- より細粒度のコントロールが可能
2. リソース不要な設計
- ガードレール ID の追跡が不要
- バージョン管理が不要
- API 呼び出し時に直接セーフガード構成を指定
3. 独立したセーフガード チェック
- 各セーフガードを独立して呼び出し可能
- プロンプト攻撃検出の 3 つのチェック (ジェイルブレイク、プロンプトインジェクション、プロンプトリーク) を個別に制御可能
- ワークフロー進化に応じてチェックを柔軟に追加、削除、調整可能
最適なユースケース
このアップデートが適している場合
エージェンティック AI アプリケーションの構築
- 複数のステップで異なるリスク プロファイルに対応する必要がある場合
- 各ステップでセーフガード構成を動的に変更したい場合
ワークフロー進化への対応
- 開発段階でセーフガードを柔軟に追加、削除、調整したい場合
- 本番環境で段階的にセーフガード要件を調整したい場合
カスタムセーフガード実装
- コンテンツフィルタ、プロンプト攻撃検出、機密情報フィルタを個別にカスタマイズしたい場合
- セーフガード違反に対して独自のアクション ロジックを実装したい場合
メリット・効果
運用面での効果
- ID 管理不要: ガードレール ID の追跡管理が不要
- バージョン管理不要: ガードレール バージョン管理の手間が削減
- シンプルな設定: 各リクエストでセーフガード構成を指定するだけ
機能面での効果
- 動的な構成変更: リクエストごとにセーフガード構成を動的に変更可能
- きめ細かい制御: 個別のセーフガードを独立して制御可能
- 柔軟なアクション: カスタムしきい値と複数のアクション オプションをサポート
開発面での効果
- 段階的な実装: ワークフロー進化に対応した段階的なセーフガード追加が容易
- テスト容易性: リソース作成不要で気軽にテスト可能
- 拡張性: 新しいセーフガード要件への対応が容易
技術仕様
API 呼び出し時に指定する項目
実行するセーフガード
- コンテンツフィルタ (有効/無効)
- プロンプト攻撃検出
- ジェイルブレイク (有効/無効)
- プロンプトインジェクション (有効/無効)
- プロンプトリーク (有効/無効)
- 機密情報フィルタ (有効/無効)
しきい値設定
- 重大度スコアの閾値
- 信頼度スコアの閾値
カスタム アクション
- ブロック、パス、再試行、ログ記録 など
返却値
- 数値の重大度スコア (0-1 の範囲)
- 信頼度スコア (0-1 の範囲)
- 検出内容の詳細情報
今後の活用方針
即座に実施できる対応
ドキュメンテーション確認
- AWS ドキュメンテーション: https://docs.aws.amazon.com/bedrock/latest/userguide/guardrails-use-invoke-guardrail-checks.html
- サンプル コード確認
テスト環境での検証
- 既存のエージェンティック AI ワークフローで適用箇所を検討
- 各ステップのリスク プロファイル定義
- セーフガード構成のテスト実施
パイロット プロジェクト実施
- 小規模なワークフローで導入テスト
- パフォーマンス、レイテンシーの確認
- セーフガード精度の検証
本番環境への段階的デプロイ
- 既存ワークフローから段階的に移行
- 監視とログ管理の構築
- フィードバック収集と改善
参考リソース
公式ドキュメント
- AWS What's New: https://aws.amazon.com/about-aws/whats-new/2026/06/amazon-bedrock-guardrails-api-ai/
- Amazon Bedrock Guardrails ドキュメント: https://docs.aws.amazon.com/bedrock/latest/userguide/guardrails-use-invoke-guardrail-checks.html
- AWS ブログ: Safeguard your agentic AI applications with the Amazon Bedrock Guardrails InvokeGuardrailChecks API
関連サービス
- Amazon Bedrock: https://aws.amazon.com/bedrock/
- Amazon Bedrock Guardrails: https://aws.amazon.com/bedrock/guardrails/
このドキュメントは 2026年6月16日 の AWS What's New 記事に基づいています。最新情報は公式ドキュメントをご確認ください。