上級読了 3 分

DynamoDB のキーオーバーロード

SQL の出身者には、列は永遠に1つの意味を持ちます: orders.created_at は常に日付、users.email は常にメールアドレスです。キーオーバーロードはそれを投げ捨てます。パーティションキーとソートキーに汎用的な名前 — pksk — を与え、各アイテム型がそこに別々の意味を注ぎ込めるようにします。1つのテーブル、多数のエンティティ、1つの形です。

DynamoDB のキーオーバーロードとは何ですか?

キーオーバーロードとは、多数のエンティティ型を pk/sk のような汎用的なキー名の下に1つのテーブルに保存し、型を値にエンコードする設計手法です(例: USER#u_3001INVOICE#2026-0014)。属性名は中立のままにするので、ユーザー、請求書、イベントが1つのパーティションを共有できます。値が型を運び、ソートキーのプレフィックスにより begins_with を使った1回の Query で各エンティティをスライスできます。

  • 汎用的なキー名、型付けされた値。 キーに pk/sk と名付け、エンティティの型を値に入れます: pk = "TENANT#acme"sk = "USER#u_3001"。名前は無頓着で、値が型を運びます。
  • これがシングルテーブル設計を機能させるもの。 オーバーロードがなければ、共有テーブルはただのガラクタ入れです。オーバーロードがあれば、すべてのエンティティが Query できるパーティションに収まります。
  • begins_with が見返り。 ソートキーの型プレフィックスにより、1回の Query でエンティティ全体、またはその一部のスライスを、Scan もフィルタもなしに取り出せます。
  • コストは可読性。 生の pk/sk のダンプは何も教えてくれません。プレフィックスをデコードするビューアが必要で、さもなければ文字列を凝視することになります。

なぜ汎用的な名前が実名に勝るのか

DynamoDB はテーブルごとに正確に2つのキー属性を持ち、Query は単一のパーティションキーしかターゲットにできません。だからキーを userId と名付けると、そのテーブルにきれいに収まるのはユーザーアイテムだけになり、それ以外はすべて userId を偽装するか、独自のテーブルに移らなければなりません。

オーバーロードはそれを回避します。pk のような中立的な名前はどのエンティティにもコミットしないので、ユーザー、請求書、監査イベントがすべて同じキー属性と同じテーブルを共有できます。アイテムが何であるかを言うのは、属性名ではなくです。

これがシングルテーブル設計を理論から実際に照会できるものへと変える一手です。共有テーブルはコンテナで、オーバーロードは別個のエンティティがその中で共存できるようにするものです。

マルチテナントの例

SaaS の課金製品を運用しているとします。各テナントにはメンバー、請求書、監査証跡があります。3つのテーブルの代わりに、それらすべてを1つに入れてキーをオーバーロードします:

pkskattributes
TENANT#acmeMETAname="Acme Inc", plan="team"
TENANT#acmeUSER#u_3001email, role="admin"
TENANT#acmeUSER#u_3002email, role="member"
TENANT#acmeINVOICE#2026-0014amount_cents, status="paid"
TENANT#acmeINVOICE#2026-0015amount_cents, status="open"
TENANT#acmeEVENT#2026-06-23T09:12Zactor="u_3001", action="invite"

すべての行が pk = "TENANT#acme" を共有するので、1つのアイテムコレクションを形成します — すべて同じ場所に配置され、すべて単一のパーティション読み取りで到達可能です。

パーティション: TENANT#acmesk: METAsk: USER#u_3001sk: INVOICE#2026-0015sk: EVENT#2026-06-23T09:12Z1回の Query

ソートキーのプレフィックスが本当の仕事をしています。エンティティをグループ化し、かつそれらを順序付けます。

オーバーロードされたコレクションを照会する

型がソートキーのプレフィックスに存在するので、begins_with は何もスキャンせずにパーティションをエンティティごとにスライスします:

Query pk = "TENANT#acme"  -- テナント全体、すべての型
Query pk = "TENANT#acme" AND begins_with(sk, "USER#")  -- メンバーだけ
Query pk = "TENANT#acme" AND begins_with(sk, "INVOICE#")  -- 請求書だけ

条件が一致するアイテム分だけ料金を払い、パーティション全体ではありません — フィルタ付き Scan の逆です。フィルタ付きスキャンでは、読んで捨てる行の分まで料金を払います。AWS はこれをキーの条件と呼びます。データがパーティションから出る前に、キーに対して実行されます。

その begins_with 条件を手で構築する場合は、型タグを正しく書きましょう — USER# の代わりにうっかり USERS# と書くと、何も返らず、しかも何も警告されません。Expression Builder は、プレフィックスが実際に書いたものと一致するよう、KeyConditionExpressionExpressionAttributeValues マップを生成します。

インデックスもオーバーロードする

同じコツが GSI にも適用されます。汎用的なキー名 — gsi1pkgsi1sk — を与え、各エンティティが必要なものを何でも書けるようにします。すると1つのインデックスが、ベーステーブルにはできないパターンに答えます。

pkskgsi1pkgsi1sk
TENANT#acmeINVOICE#2026-0015STATUS#open2026-06-30
TENANT#acmeINVOICE#2026-0014STATUS#paid2026-06-12
TENANT#betaINVOICE#2026-0099STATUS#open2026-06-25

これで Query gsi1 WHERE gsi1pk = "STATUS#open" が、すべてのテナントにわたるすべての未払い請求書を、支払期日順でリストします — ベーステーブルのテナントスコープのキーでは決して提供できないクロスパーティションのビューです。別のエンティティが独自の意味で gsi1 を再利用できる(たとえば gsi1pk = "ROLE#admin")ので、1つのインデックスが複数の読み取りをカバーします。ただし GSI は結果整合性であることを覚えておきましょう — その書き込みはベーステーブルに遅れます。

DynoTable でやってみる

生のオーバーロードされたキーは読むのに敵対的です: INVOICE#2026-0015EVENT#2026-06-23T09:12Z はフラットなリストの中で混ざり合います。パーティションでグループ化してプレフィックスを浮かび上がらせるビューアが、ガラクタ入れをエンティティに戻します。

DynoTable で1つのテナントのアイテムコレクションを閲覧 — META、USER、INVOICE、EVENT のアイテムが単一のオーバーロードされたパーティションキーの下にグループ化されている。
DynoTable で1つのテナントのアイテムコレクションを閲覧 — META、USER、INVOICE、EVENT のアイテムが単一のオーバーロードされたパーティションキーの下にグループ化されている。

落とし穴

  • 区切り文字は一度選んだら決して変えない。 # が慣例です。エンティティ間で #: を混ぜると、何も警告されない形で begins_with が壊れます。
  • 範囲計算が必要な値をオーバーロードしない。 INVOICE#2026-0015 というソートキーは数値ではなく辞書順でソートされます — ID をゼロ埋めし、ISO-8601 の日付を使って、文字列順が意図した順序と一致するようにしましょう。
  • プレフィックスの名前空間を予約する。 どちらも USER で始まる2つのエンティティ型(たとえば USER#USERGROUP#)は、begins_with(sk, "USER") の下で衝突します。プレフィックスは最初の文字から曖昧でないようにしましょう。
  • キーの前に読み取りを計画する。 オーバーロードは、列挙済みのアクセスパターンに奉仕します。まだ読み取りがわからないなら、まずシングルテーブル設計を参照してください — キーはクエリの下流にあります。

パーティションを描き出したら、DynoTable をダウンロードして、自分のオーバーロードされたキーを閲覧し、1回の Query がテナント全体をまとめて返す様子を観察しましょう。

更新日