AWS
Amazon SageMaker と vLLM を組み合わせて、高速な LLM 推論基盤を構築する方法を解説します。AWS の LMI(Large Model Inference)コンテナを活用し、AsyncLLMEngine による非同期処理、Continuous Batching によるスループット向上、コールドスタート対策…
はじめに こんにちは!askenでSRE/インフラエンジニアをしている小林です。 普段は「あすけん」アプリのインフラ全般の企画から運用まで一貫して対応しています。 今回は、Amazon Bedrock AgentsのAgentCore Runtimeに対して、別AWSアカウントからアクセスす…
はじめに こんにちは。インフラエンジニアの鈴木です。 この記事は、株式会社asken (あすけん) Advent Calendar 2025の12/12の記事です。 今回は「開発の手動構築を、AWS MCP ServerでサッとIaC管理へ移行する」方法を紹介します。 (ここでのIaC管理とは、…
はじめに インフラエンジニアの鈴木です。AWS Summit 2025に現地参加してきました! AWS Summitはアマゾン ウェブ サービス (AWS) が主催する、日本最大級のAWSイベントです。 AWS Summitというと、オンラインで配信もしてるし、「現地まで行く必要あるの?…
こんにちは、インフラのテックリードをしている沼沢です。 この記事は、「あすけんの Aurora 2 → Aurora 3 へのメジャーバージョンアップ軌跡」の第4弾です。 過去の記事はこちらからお読みください。 あすけんの Aurora 2 → Aurora 3 へのメジャーバージョ…
こんにちは、インフラのテックリードをしている沼沢です。 この記事は、「あすけんの Aurora 2 → Aurora 3 へのメジャーバージョンアップ軌跡」の第3弾です。 第1弾、第2弾はこちらからお読みください。 あすけんの Aurora 2 → Aurora 3 へのメジャーバージ…
こんにちは、インフラのテックリードをしている沼沢です。 この記事は、株式会社asken (あすけん) Advent Calendar 2024 の23日目の記事です。 また、「あすけんの Aurora 2 → Aurora 3 へのメジャーバージョンアップ軌跡」の第2弾です。 第1弾「絶望篇」は…
こんにちは、インフラのテックリードをしている沼沢です。 この記事は、株式会社asken (あすけん) Advent Calendar 2024 の11日目の記事です。 また、「あすけんの Aurora 2 → Aurora 3 へのメジャーバージョンアップ軌跡」の第1弾の記事です。 あすけんは A…