AWS上級 #3 Lambda 基礎

読了 10分

#1 ECS / Fargate#2 ECRコンテナが常に立ち上がっている モデルでした。トラフィックが 0 のときも 1 個のコンテナは生きています。トラフィックの変動が大きい、短い処理だけが必要、運用負担をさらに減らしたい場合には別の選択肢がしっくりきます — Lambda

今回は Lambda の動作、モデル (runtime / handler / event)、呼び出し方式、コールドスタート、並行性と上限、ロギングまで一気に整理します。

Lambda がすること #

AWS Lambda はサーバーレス関数実行プラットフォーム。イベント が入ってきたらようやく関数が目を覚まし、終わると再び消えます。トラフィックが 0 ならコストも 0。

Lambda の絵
イベント (HTTP / S3 アップロード / SQS メッセージ / Cron)
Lambda がコンテナを hot または cold で立ち上げ
私のハンドラ関数を実行 (数 ms 〜 15 分)
レスポンス / 結果 → 呼び出し元
一定時間 idle 後コンテナを終了

いつ Lambda がしっくりくるか #

Lambda がしっくりくる場合 #

  • イベント駆動 — S3 アップロード → サムネイル生成、SQS メッセージ → 処理、EventBridge スケジュール → バッチ
  • 変動の大きいトラフィック — 普段 0、たまに急増。0 のときコストかからない
  • 短い処理 — 通常数秒〜数分
  • サイド / 補助ワークロード — メインシステムの隣の補助関数
  • API の一部だけ — すべての API が Lambda である必要なし。一部だけ

Lambda が合わない場合 #

場合理由
常にトラフィックが回る大きな API並行性 / コールドスタート / 費用で ECS が有利
15 分超の処理Lambda 1 回の呼び出しは最大 15 分
非常に大きいメモリ / GPULambda は最大 10 GB メモリ、GPU なし
Stateful 接続 (WebSocket のバックエンド等)可能だが設計が複雑
常に on の DB connection pool呼び出し毎に新しく接続される方式

比較 #

EC2ECS / FargateLambda
立ち上がっている時間常に常に (Service)呼び出し毎
運用負担中 (Fargate は小)
コールドスタートなしあり (数十 ms 〜 数秒)
時間上限無限無限15 分
トラフィック 0 のコスト0
同時処理OS レベル1 コンテナで多重関数インスタンス 1 つ当たり同時 1 つ

最後の行が重要: Lambda は 関数インスタンス 1 つが同時に 1 つの呼び出しだけ を処理。同時呼び出しが N 個ならインスタンスも N 個に自動拡張。

最初の Lambda — Hello, World #

関数を作る (コンソール) #

コンソール → Lambda → “関数の作成” → 直接作成 → Python 3.13。

lambda_function.py (コンソールのデフォルト)
def lambda_handler(event, context):
    return {
        "statusCode": 200,
        "body": "Hello, Lambda"
    }

保存して “テスト” — 空のイベントで呼び出し。CloudWatch Logs に自動でロググループ (/aws/lambda/<関数名>) 作成。

CLI で作る #

コードを zip でまとめ:

zip + 作成
zip function.zip lambda_function.py

aws lambda create-function \
  --function-name hello \
  --runtime python3.13 \
  --role arn:aws:iam::123456789012:role/lambda-basic-role \
  --handler lambda_function.lambda_handler \
  --zip-file fileb://function.zip

IaC (Terraform を少し) #

terraform
resource "aws_lambda_function" "hello" {
  function_name = "hello"
  runtime       = "python3.13"
  handler       = "lambda_function.lambda_handler"
  role          = aws_iam_role.lambda.arn
  filename      = "function.zip"
  source_code_hash = filebase64sha256("function.zip")

  memory_size = 256
  timeout     = 10
}

モデル — Runtime / Handler / Event / Context #

Lambda のモデルを 4 つのキーワードで整理。

Runtime #

言語 + バージョン。マネージド runtime:

  • Python (3.10 〜 3.13)
  • Node.js (18、20、22)
  • Java (8、11、17、21)
  • .NET、Ruby、Go (provided.al2023 の上)
  • Custom Runtime — Rust / Zig / Swift 等を直接対応

または コンテナイメージ (ECR) でデプロイ — 上の #2 ECR と自然に接続。大きな依存があるとき有利 (zip 上限 250MB、コンテナは 10GB)。

Handler #

Lambda が呼び出す関数の名前。<ファイル名>.<関数名> 形式。

myapp/handler.py
def main(event, context):
    ...

→ Handler 設定: myapp.handler.main

Event #

呼び出し元が送ったデータ。JSON オブジェクト。呼び出しソース毎に形が違う。

API Gateway の event
{
  "version": "2.0",
  "routeKey": "GET /hello",
  "headers": {...},
  "queryStringParameters": {...},
  "body": "..."
}
S3 ObjectCreated の event
{
  "Records": [
    {
      "eventSource": "aws:s3",
      "s3": {
        "bucket": {"name": "my-bucket"},
        "object": {"key": "uploads/photo.jpg"}
      }
    }
  ]
}

Lambda Powertools (Python / TypeScript / Java) のようなライブラリがこの event 達を型安全に扱うのに役立ちます — 実戦では積極的に活用。

Context #

ランタイム情報。関数実行時間上限 (get_remaining_time_in_millis())、request id、関数名等。

context が持つ情報
def handler(event, context):
    print(context.aws_request_id)
    print(context.function_name)
    print(context.get_remaining_time_in_millis())  # 残り時間 ms

呼び出し方式 — 同期 vs 非同期 vs ストリーム #

呼び出しソースに応じて Lambda の動作が変わります。

1) 同期 (Synchronous) #

呼び出し元が結果を待つ。レスポンスを受け取るまでブロック。

呼び出しソース
API Gateway
ALB
Cognito
直接 Invoke API
aws lambda invoke \
  --function-name hello \
  --payload '{"name": "world"}' \
  --cli-binary-format raw-in-base64-out \
  out.json

2) 非同期 (Asynchronous) #

呼び出し元が「キューに入れて」終わり。Lambda がバックグラウンドで処理。失敗時に自動再試行 (デフォルト 2 回) + DLQ (Dead Letter Queue) に送付。

呼び出しソース
S3 ObjectCreated
SNS
EventBridge
InvocationType=Event の Invoke
aws lambda invoke \
  --function-name hello \
  --invocation-type Event \
  --payload '{"key": "value"}' \
  --cli-binary-format raw-in-base64-out \
  out.json

3) ストリーム / ポーリング #

Lambda がキュー / ストリームを自動ポーリング。

呼び出しソース
SQS
DynamoDB Streams
Kinesis
MSK (Managed Kafka)

設定だけしておけば新メッセージが来るたびに Lambda が batch で受け取り処理。失敗すれば retry + DLQ。

並行性 (Concurrency) の意味 #

Lambda の最も重要な点の 1 つです。関数インスタンス 1 つが同時に 1 つの呼び出しだけ処理するので、同時に入ってきた呼び出し数 = 立ち上がったインスタンス数

同時呼び出しの流れ
秒 10 個の呼び出し、各呼び出し 1 秒 → 同時 〜10 個のインスタンス
秒 100 個の呼び出し、各呼び出し 100ms → 同時 〜10 個のインスタンス

アカウント上限 (Account Concurrency) #

リージョン別デフォルト 1,000。運用ワークロードはしばしば不足 — Service Quotas コンソールで増額リクエスト。

Reserved Concurrency #

特定の関数に「最大 N 個」を保証 + 制限。

この関数は最大 100 個
aws lambda put-function-concurrency \
  --function-name hello \
  --reserved-concurrent-executions 100

用途:

  • 危険な関数の暴走を遮断 (例: 有料の外部 API を呼ぶ関数)
  • 他の重要な関数に並行性の余裕を残す (この関数が 1,000 を独占しないように)
  • DB connection 暴走防止 (RDS connection pool 保護)

Provisioned Concurrency — コールドスタート回避 #

事前に N 個のインスタンスを温めておく。同時呼び出しが N 以下ならコールドスタート 0。

aws lambda put-provisioned-concurrency-config \
  --function-name hello \
  --qualifier prod \
  --provisioned-concurrent-executions 10

費用: 温めておいたインスタンスの時間分課金 (やや安い単価)。API の入口でコールドスタートがユーザー体験に直接影響なら検討。

コールドスタート — 最もよく出会う落とし穴 #

関数インスタンスが新たに作られるときの初期コスト。2 段階。

コールドスタートの分解
[INIT 段階] — 1 度だけ
  ├─ コンテナ環境準備
  ├─ runtime 起動
  ├─ ハンドラモジュール import
  └─ ハンドラ関数の外のコード実行 (グローバル)
[INVOKE 段階] — 呼び出し毎に
  └─ ハンドラ関数の実行

INIT は インスタンスの最初の呼び出しでのみ コスト。同じインスタンスが次の呼び出しを受ければ INIT スキップ (warm)。

コールドスタート時間 #

おおよその目安:

言語 / 形態INIT 時間
Python (小さな依存)〜150 ms
Python (大きな依存、e.g. boto3 + pandas)〜1 〜 2 秒
Node.js (小さい)〜100 ms
Java〜500 ms 〜 数秒
コンテナイメージ (大きい)〜数秒

コールドスタートを減らす #

  1. メモリを増やす — Lambda はメモリに比例して vCPU も増える。256MB → 1024MB だけでも INIT が速くなる
  2. 依存のスリミング — 使わないパッケージを除外、tree-shaking
  3. グローバル変数の活用 — ハンドラ外で 1 度作ったオブジェクト (boto3 client、DB connection 等) を warm なインスタンスが再利用
  4. Provisioned Concurrency — 上で見た通り
  5. Lambda SnapStart (Java) — INIT 結果のスナップショットを取って高速復帰。Java 限定

グローバル変数パターン #

良いパターン — グローバルで client を作る
import boto3

# Lambda インスタンス 1 度だけ — INIT 段階
s3 = boto3.client("s3")

def handler(event, context):
    # ハンドラはきれいに — 呼び出し毎に client を作らない
    return s3.list_buckets()
悪いパターン
def handler(event, context):
    # 呼び出し毎に boto3 client — 遅い
    s3 = boto3.client("s3")
    return s3.list_buckets()

メモリと時間上限 #

項目上限
メモリ128 MB 〜 10,240 MB (1 MB 単位)
時間1 秒 〜 900 秒 (15 分)
一時ディスク (/tmp)512 MB 〜 10 GB
環境変数4 KB
Payload (同期)6 MB
Payload (非同期)256 KB
zip (ソース)50 MB (圧縮)
zip (展開)250 MB
コンテナイメージ10 GB

メモリは vCPU と紐づいています。1,769 MB で vCPU 1 個分。メモリを増やすと CPU も増えて関数が速くなる場合がよくあります — メモリを増やすだけで費用が減ることも (Lambda Power Tuning で最適値を探す)。

ロギング — CloudWatch Logs #

Lambda の全ての stdout / stderr は自動で CloudWatch Logs/aws/lambda/<関数名> ロググループに入ります。

ロギング
import logging

logger = logging.getLogger()
logger.setLevel(logging.INFO)

def handler(event, context):
    logger.info("Hello %s", event.get("name"))
    return "ok"

運用では 構造化ログ 推奨 — JSON で出力すれば CloudWatch Logs Insights でフィールド別クエリ可能。

JSON ログ
import json, logging

logger = logging.getLogger()

def handler(event, context):
    logger.info(json.dumps({
        "request_id": context.aws_request_id,
        "user_id": event.get("user_id"),
        "action": "process",
        "duration_ms": 42
    }))

PowertoolsLogger がこれを 1 行できれいに。

Layers — コードの再利用 #

複数の関数が同じ依存 / ユーティリティを使うとき Lambda Layer で分離。

Layer を作る
# python の依存
mkdir -p python
pip install requests -t python/
zip -r layer.zip python

aws lambda publish-layer-version \
  --layer-name my-utils \
  --zip-file fileb://layer.zip \
  --compatible-runtimes python3.13
関数に付ける
aws lambda update-function-configuration \
  --function-name hello \
  --layers arn:aws:lambda:ap-northeast-2:123456789012:layer:my-utils:1

長所: 関数 zip が小さく、依存の更新が 1 回。 短所: 多くなりすぎると追跡が困難。5 個まで。

Lambda の費用 #

Lambda 費用
呼び出し当たり費用 = (呼び出し数 × $0.0000002)
                + (実行時間 GB-秒 × $0.0000166667)

月 100 万呼び出し + 呼び出し当たり 100ms + 256MB:

  • 呼び出し費用: 100 万 × $0.0000002 = $0.20
  • 時間費用: 100 万 × 0.1 秒 × 0.25GB × $0.0000166667 = $0.42
  • 合計: 〜$0.62 / 月

非常に安い。無料枠で月 100 万呼び出し + 400,000 GB-秒が無料。小さなワークロードは事実上 0。

費用が大きくなる場合:

  • 呼び出し当たりの時間が長く、メモリが大きい関数 (e.g. 5 分 × 3GB)
  • 並行性が常に高い関数 — ECS / Fargate の方が安いことも

よく出会う落とし穴 #

1) コールドスタートで最初の呼び出しが遅い #

API 入口の Lambda が 0.5 〜 2 秒ずつかかる。ユーザーが耐えられません。上の「コールドスタートを減らす」5 つ + Provisioned Concurrency を検討。

2) ハンドラの中で毎回オブジェクトを作る #

def handler(event, context):
    db = create_db_connection()
    boto = boto3.client("s3")
    ...

呼び出し毎に 100ms の無駄。グローバルに引き上げる。

3) RDS connection pool の暴走 #

Lambda 同時 100 個 → DB 接続 100 個 → DB の connection 上限超過。 代替:

  • RDS Proxy — Lambda 達が共有する connection pool
  • Reserved Concurrency で関数並行性を制限
  • DynamoDB のようなサーバーレス DB を使用

4) 非同期呼び出しの失敗が静かに消える #

S3 → Lambda が失敗しても呼び出し元は知りません。DLQ (SQS) または Lambda Destination で失敗をキャプチャ。

非同期失敗を SQS DLQ に
aws lambda put-function-event-invoke-config \
  --function-name hello \
  --maximum-retry-attempts 2 \
  --destination-config '{"OnFailure":{"Destination":"arn:aws:sqs:...:dlq"}}'

5) 時間切れで切られる #

15 分上限を知らずに大きな処理を 1 つの関数で — 14 分 59 秒で強制終了。長い処理は #7 Step Functions で分割 または ECS / Fargate。

6) Payload が 6MB を超える #

API Gateway → Lambda 同期呼び出しの上限。大きなファイルは S3 presigned URL パターンで回避 — Lambda が presigned URL だけ発行、クライアントが直接 S3 にアップロード。

7) 環境変数に秘密 #

平文の環境変数に DB パスワード → ログ / コンソールで露出。#6 Secrets Manager に移す。

まとめ #

今回つかんだもの:

  • Lambda の使いどころ — イベント駆動、変動の大きいトラフィック、短い処理、サイドワークロード。トラフィック 0 なら費用 0
  • Lambda が合わない場合 — 常に大きいトラフィック、15 分超過、大きいメモリ / GPU、stateful
  • モデル — Runtime / Handler / Event / Context。Event の形は呼び出しソース毎に
  • 呼び出し方式 — 同期 / 非同期 / ストリーム。非同期は自動 retry + DLQ
  • 並行性 — 関数インスタンス 1 つ = 同時 1 呼び出し。呼び出しが増えるとインスタンスが自動拡張
  • Reserved Concurrency — 暴走遮断 + 他の関数を保護
  • Provisioned Concurrency — コールドスタート回避
  • コールドスタート — INIT のコスト。メモリを増やす / 依存スリミング / グローバル変数 / SnapStart / Provisioned で緩和
  • 上限 — メモリ 10GB、時間 15 分、payload 6MB、コンテナ 10GB
  • ロギング — CloudWatch Logs に自動。JSON 構造化ログ推奨
  • Layers — 依存の共有 (5 個まで)
  • 費用 — 呼び出し + 実行時間。小さなワークロードはほぼ 0
  • 落とし穴 — コールドスタート、ハンドラ内オブジェクト作成、RDS 暴走 (RDS Proxy)、非同期失敗の漏れ (DLQ)、15 分上限、Payload 6MB、環境変数の秘密

次回 — API Gateway + Lambda #

関数だけでは呼び出す経路が足りません。HTTP リクエスト で Lambda を呼ぶ最もよくあるパターン — API Gateway + Lambda — を次回。

#4 API Gateway + Lambda では REST API と HTTP API の違い、Lambda 統合、ルート / メソッド、権限 (IAM / Cognito / Lambda authorizer)、ステージ / デプロイまで — サーバーレス API の使いどころを一気に整理します。

X