Amazon SageMaker JumpStart で利用可能な4つの新しい Qwen モデル
本ページの内容はAIが作成しているため、ハルシネーションに注意してご自身で詳細はご確認ください。
スライド
スライドを読み込み中...
サマリ
Amazon SageMaker JumpStart で利用可能な4つの新しい Qwen モデル
カテゴリ: What's New
公開日: 2026-05-04
元記事: https://aws.amazon.com/about-aws/whats-new/2026/05/qwen-models-on-sagemaker-jumpstart/
要約
Amazon SageMaker JumpStart で、マルチモーダル推論、エージェント型コーディング、軽量エッジデプロイメント向けの4つの新しい Qwen モデルが利用可能になりました。これらのモデルは、画像・ビデオ分析、多言語対応、コード生成など、様々な AI アプリケーション要件に対応しており、SageMaker Studio から数クリックで簡単にデプロイできます。
詳細
新しく利用可能なモデル
Qwen3.5-27B-FP8 - マルチモーダルビジョン言語モデル
- 画像、ビデオ、テキストに対する推論が可能
- エンタープライズ向け分析アプリケーション
Qwen3.6-35B-A3B - エージェント型コーディング最適化
- Mixture-of-Experts アーキテクチャ
- 複雑なマルチステップコード推論に対応
Qwen3.5-0.8B - 小型マルチモーダルモデル
- 迅速なプロトタイピング、ファインチューニング
- オンデバイス推論、エッジデプロイメント向け
Qwen3.5-2B - 軽量マルチモーダルモデル
- プロトタイピングと中程度のコンピュート環境向け
デプロイメント方法
- SageMaker Studio: UI から数クリックでデプロイ可能
- SageMaker Python SDK: プログラマティックなデプロイ
- 自動スケーリング: SageMaker のエンドポイント機能
ユースケース
- 複雑な画像推論・ビデオ分析: 製造業の品質検査、医療画像診断
- エージェント型コーディング: ソフトウェア開発支援、テストコード生成
- リソース制限環境: IoT デバイス、オンプレミス推論
- 多言語対応: 200 以上の言語をサポート
- エッジデプロイメント: リアルタイム処理、オンデバイス推論
メリット
- 開発速度: ワンクリックデプロイメントで迅速な展開
- コスト最適化: 用途別のモデルサイズ選択
- スケーラビリティ: AWS インフラの自動スケーリング
- 推論精度: マルチモーダル対応による高精度処理
- セキュリティ: AWS VPC 内での実行