Amazon Bedrock Guardrailsがエージェンティック AI ワークフロー向け新APIを発表 - AWS What's New Slides

Amazon Bedrock Guardrailsがエージェンティック AI ワークフロー向け新APIを発表

本ページの内容はAIが作成しているため、ハルシネーションに注意してご自身で詳細はご確認ください。

スライド

スライドを読み込み中...

サマリ

Amazon Bedrock Guardrailsがエージェンティック AI ワークフロー向け新APIを発表

Amazon Bedrock Guardrails announces a new API targeting agentic AI workflows

カテゴリ: What's New 公開日: 2026-06-16 元記事: AWS What's New


要約

Amazon Bedrock Guardrailsの新しいInvokeGuardrailChecks APIは、ガードレールリソースを作成することなく、エージェンティックAIアプリケーションの各ステップで個別のセーフガードを柔軟に適用できるリソースレスAPIです。このアップデートは、複数のステップで異なるリスクプロファイルに対応し、コンテンツフィルタ、プロンプト攻撃検出、機密情報フィルタなどのセーフガードをカスタマイズして実装する必要があるユーザーに特に適しています。


主な変更点

InvokeGuardrailChecks API の発表

  • 新しいリソースレスAPI: ガードレール リソースを作成することなく、エージェンティック AI アプリケーションの任意のポイントで個別のセーフガードを適用可能
  • ステップごとの柔軟な構成: エージェンティック AI ループの各ステップで異なるリスク プロファイルに対応
  • リクエストごとの制御: APIはリクエストごとにどのセーフガードを実行するかを指定でき、ガードレールID の追跡やバージョン管理が不要

対応するセーフガード

1. コンテンツフィルタ

  • ヘイト、暴力、性的、侮辱、不正行為を含む有害コンテンツを検出

2. プロンプト攻撃検出

  • ジェイルブレイク: 不正なシステム プロンプト操作を検出
  • プロンプトインジェクション: ユーザー入力への悪意あるプロンプトインジェクションを検出
  • プロンプトリーク: プロンプトの漏洩を検出
  • 重要: 各チェックは独立したセーフガードとして実装され、個別に呼び出し可能

3. 機密情報フィルタ

  • サポートされている PII (個人識別情報) エンティティタイプを検出

カスタマイズ可能なアクション

  • 数値の重大度スコアと信頼度スコアを返却
  • カスタムしきい値を設定可能
  • 以下のアクションをカスタマイズ実装可能:
    • ブロック: 違反を検出した場合にリクエストを拒否
    • パス: 検出されても処理を続行
    • 再試行: ユーザーに修正を促す
    • ログ記録: セキュリティ監視ログに記録

利用可能なリージョン

一般提供 (GA) リージョン

  • 米国

    • US East (N. Virginia)
    • US East (Ohio)
    • US West (Oregon)
  • ヨーロッパ

    • Europe (London)
    • Europe (Stockholm)
  • アジアパシフィック

    • Asia Pacific (Tokyo)
    • Asia Pacific (Sydney)

設計上の特徴

1. Detect-Only モード

  • セーフガード違反を検出するのみで、自動ブロックは行わない
  • 開発者がカスタムロジックで対応方法を決定
  • より細粒度のコントロールが可能

2. リソース不要な設計

  • ガードレール ID の追跡が不要
  • バージョン管理が不要
  • API 呼び出し時に直接セーフガード構成を指定

3. 独立したセーフガード チェック

  • 各セーフガードを独立して呼び出し可能
  • プロンプト攻撃検出の 3 つのチェック (ジェイルブレイク、プロンプトインジェクション、プロンプトリーク) を個別に制御可能
  • ワークフロー進化に応じてチェックを柔軟に追加、削除、調整可能

最適なユースケース

このアップデートが適している場合

  1. エージェンティック AI アプリケーションの構築

    • 複数のステップで異なるリスク プロファイルに対応する必要がある場合
    • 各ステップでセーフガード構成を動的に変更したい場合
  2. ワークフロー進化への対応

    • 開発段階でセーフガードを柔軟に追加、削除、調整したい場合
    • 本番環境で段階的にセーフガード要件を調整したい場合
  3. カスタムセーフガード実装

    • コンテンツフィルタ、プロンプト攻撃検出、機密情報フィルタを個別にカスタマイズしたい場合
    • セーフガード違反に対して独自のアクション ロジックを実装したい場合

メリット・効果

運用面での効果

  • ID 管理不要: ガードレール ID の追跡管理が不要
  • バージョン管理不要: ガードレール バージョン管理の手間が削減
  • シンプルな設定: 各リクエストでセーフガード構成を指定するだけ

機能面での効果

  • 動的な構成変更: リクエストごとにセーフガード構成を動的に変更可能
  • きめ細かい制御: 個別のセーフガードを独立して制御可能
  • 柔軟なアクション: カスタムしきい値と複数のアクション オプションをサポート

開発面での効果

  • 段階的な実装: ワークフロー進化に対応した段階的なセーフガード追加が容易
  • テスト容易性: リソース作成不要で気軽にテスト可能
  • 拡張性: 新しいセーフガード要件への対応が容易

技術仕様

API 呼び出し時に指定する項目

  1. 実行するセーフガード

    • コンテンツフィルタ (有効/無効)
    • プロンプト攻撃検出
      • ジェイルブレイク (有効/無効)
      • プロンプトインジェクション (有効/無効)
      • プロンプトリーク (有効/無効)
    • 機密情報フィルタ (有効/無効)
  2. しきい値設定

    • 重大度スコアの閾値
    • 信頼度スコアの閾値
  3. カスタム アクション

    • ブロック、パス、再試行、ログ記録 など

返却値

  • 数値の重大度スコア (0-1 の範囲)
  • 信頼度スコア (0-1 の範囲)
  • 検出内容の詳細情報

今後の活用方針

即座に実施できる対応

  1. ドキュメンテーション確認

  2. テスト環境での検証

    • 既存のエージェンティック AI ワークフローで適用箇所を検討
    • 各ステップのリスク プロファイル定義
    • セーフガード構成のテスト実施
  3. パイロット プロジェクト実施

    • 小規模なワークフローで導入テスト
    • パフォーマンス、レイテンシーの確認
    • セーフガード精度の検証
  4. 本番環境への段階的デプロイ

    • 既存ワークフローから段階的に移行
    • 監視とログ管理の構築
    • フィードバック収集と改善

参考リソース

公式ドキュメント

関連サービス


このドキュメントは 2026年6月16日 の AWS What's New 記事に基づいています。最新情報は公式ドキュメントをご確認ください。