継続は力なり

タイトル通り定期的な更新を心掛けるブログです。

Amazon Bedrock の推論プロファイルがコスト配分タグをサポートしたメモ✍

タダです.

Amazon Bedrock のアプリケーション推論プロファイルでコスト配分タグがサポートされました. 部門やチーム, アプリケーション単位で生成 AI のオンデマンド推論コストを分解できるようになったのでメモします.

aws.amazon.com

アプリケーション推論プロファイルとは

アプリケーション推論プロファイルはユーザーが作成する推論プロファイルで, モデル呼び出しの使用量とコストをトラッキングするためのリソースです. 単一リージョンの基盤モデル, もしくはクロスリージョン(システム定義)推論プロファイルを modelSource に指定して作成します.

  • 単一リージョン: 指定した基盤モデルのそのリージョンでの使用量・コストを追跡
  • クロスリージョン: 指定したシステム定義推論プロファイルに含まれるリージョンにルーティングしつつ, まとめて追跡

docs.aws.amazon.com

コスト配分タグで何が嬉しいか

従来はアカウント単位や基盤モデル単位でしか Bedrock のオンデマンド費用を切り分けられず, 「このチームが何に使っているか」を分解しづらい状況でした. アプリケーション推論プロファイルにタグを付け, AWS Billing 側でそのタグをコスト配分タグとして有効化すれば, Cost Explorer や AWS Cost and Usage Report でタグ別にフィルタ・グループ化できます.

  • 部門・チーム別のチャージバック / ショーバック
  • アプリケーション / 環境 (dev, stg, prod) 別のコスト可視化
  • FinOps での使用量モニタリング

docs.aws.amazon.com

作り方と使い方

現状, アプリケーション推論プロファイルの作成は API のみです. CreateInferenceProfile API を呼び, tags にキー / バリューを付与します.

aws bedrock create-inference-profile \
    --region ap-northeast-1 \
    --inference-profile-name taddy-claude-sonnet-4-6 \
    --model-source 'copyFrom=arn:aws:bedrock:ap-northeast-1:[AWSアカウント番号]:inference-profile/jp.anthropic.claude-sonnet-4-6' \
    --tags '[{"key":"Team","value":"taddy"},{"key":"Env","value":"dev"}]'
{
    "inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:[AWSアカウント番号]:application-inference-profile/[推論プロファイルID]",
    "status": "ACTIVE"
}

作成後は list-inference-profiles--type-equals APPLICATION を指定して, 作成済みのアプリケーション推論プロファイルを確認できます.

aws bedrock list-inference-profiles --region 'ap-northeast-1' \
    --type-equals 'APPLICATION'
{
    "inferenceProfileSummaries": [
        {
            "inferenceProfileName": "taddy-claude-sonnet-4-6",
            "createdAt": "2026-04-18T10:16:33.675332+00:00",
            "updatedAt": "2026-04-18T10:16:33.675332+00:00",
            "inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:[AWSアカウント番号]:application-inference-profile/[推論プロファイルID]",
            "models": [
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.claude-sonnet-4-6"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-6"
                }
            ],
            "inferenceProfileId": "[推論プロファイルID]",
            "status": "ACTIVE",
            "type": "APPLICATION"
        }
    ]
}

レスポンスで返る inferenceProfileArn をモデル呼び出し時の modelId に指定すると, そのプロファイル経由での使用量がタグごとに記録されます.

  • InvokeModel / InvokeModelWithResponseStream
  • Converse / ConverseStream
  • RetrieveAndGenerate(Knowledge Bases)
  • CreateEvaluationJob, CreatePrompt, CreateFlow, CreateDataSource

docs.aws.amazon.com

作成後は Billing コンソールの「コスト配分タグ」で対象タグを有効化し, 反映されるまでしばらく待つ必要があります. なお, プロファイルの作成・呼び出しには bedrock:CreateInferenceProfile / bedrock:TagResource / bedrock:InvokeModel 等の IAM 権限が必要で, 誰が任意のタグを付けられるかはポリシーで絞っておくのが安全です(チャージバックの付け替えを防ぐ観点で).

まとめ

Amazon Bedrock の推論プロファイルがコスト配分タグをサポートしたので, 使い方と嬉しさをまとめました. 生成 AI コストを組織単位で可視化したいチームは一度導入を検討してみるとよさそうです.