AWS Lambda レスポンスストリーミング
スライド
サマリ
AWS Lambda expands response streaming support to all commercial AWS Regions
カテゴリ: What's New 公開日: 2026-04-07T21:00:00 元記事: https://aws.amazon.com/about-aws/whats-new/2026/04/aws-lambda-response-streaming/
要約
AWS Lambdaのレスポンスストリーミング機能がすべての商用リージョンで利用可能になり、InvokeWithResponseStream APIを通じてクライアントにデータを段階的に配信できるようになりました。これにより、LLMアプリケーションやウェブ・モバイルアプリケーションなどのレイテンシー敏感なワークロードにおいて、初回バイト時間を削減し、ユーザー体験を向上させることができます。
詳細
AWS Lambdaのレスポンスストリーミング機能が、すべての商用AWSリージョンで利用可能になったことが発表されております。
InvokeWithResponseStream APIを使用することで、クライアントに対してデータが利用可能になった時点で段階的にレスポンスペイロードをストリーミング配信できるようになっております。
レスポンスストリーミングは、レスポンス全体をバッファリングする前に部分的なレスポンスをクライアントに送信することで、初回バイト時間(TTFB)のレイテンシーを削減できます。
LLMベースのアプリケーション、ウェブアプリケーション、モバイルアプリケーションなど、レイテンシーに敏感なワークロードに適しており、ユーザーがレスポンスを段階的に表示されるのを確認できるメリットがあります。
レスポンスストリーミングは最大200MBのデフォルト上限までのペイロードをサポートしております。
Node.jsマネージドランタイムおよびカスタムランタイムの両方でレスポンスストリーミングをサポートしております。
Amazon API Gateway REST APIでレスポンスストリーミングを有効にすることで、サポートされているAWS SDKを通じてストリーミング配信が可能です。
ストリーミングレスポンスには、レスポンスペイロードのネットワーク転送に対する追加コストが発生し、Lambda関数から最初の6MBを超えて生成・ストリーミングされたバイト数に基づいて課金されます。