LLMの環境負荷――推論・学習のCO2排出量と持続可能なAI運用

LLMの環境負荷は「学習段階」と「推論段階」の2フェーズで異なる性質を持つ。GPT-3クラスの学習では約552トンのCO2が排出されるが、実は累積インパクトは推論段階の方が大きい。本記事では実データに基づいて環境負荷を解説し、企業が実践できる7つの削減アプローチを紹介する。

LLMの環境負荷の実態

ChatGPTが1日に処理するクエリは数千万件とも言われる。1クエリあたりのエネルギー消費は小さくても、積み上がると大規模な電力消費となる。AI産業全体のデータセンター電力消費は2026年時点で世界の総電力消費の約2〜3%に達するとも試算されており、今後さらに拡大することが見込まれる。

【LLMのライフサイクルとエネルギー消費の全体図】

  [1. 学習フェーズ] ---------> [2. 推論フェーズ] ---------> [累積影響]
        |                            |                          |
  莫大なGPUクラスター            CPUまたはGPU              数千万〜数億回
  数週間〜数ヶ月                  1クエリ数秒               の繰り返し
  1回だが極大                    1回は小さい               トータルで巨大
        |                            |
  [データセンター冷却]
  電力消費の30〜50%が冷却
  PUE (電力効率) が重要指標

  CO2排出源: 電力消費量 x 電力のCO2排出係数 (地域・エネルギー源による)

GPT-3 (1750億パラメータ) の学習では約552トンのCO2が排出されたと推定されている。これは乗用車が約140台1年間走行する量に相当する。なお、正確な排出量は使用するデータセンターの電力源 (再生可能エネルギー比率) によって大きく変わる。

学習フェーズ vs 推論フェーズの環境負荷

「学習が一番環境に悪い」と思われがちだが、実は推論フェーズの累積影響が学習を超えるという研究が増えている。学習は1回だけの巨大消費だが、推論は毎日数千万回繰り返されるからだ。

フェーズ	電力消費 (1回)	CO2排出量 (1回)	頻度	累積影響	最適化余地
学習	数百〜数千 MWh	数百〜数千 t-CO2	1回 (再学習時追加)	大 (1回限り)	効率的アーキテクチャ、量子化後学習
ファインチューニング	1〜100 MWh	1〜100 t-CO2	数ヶ月ごと	中	LoRA等の効率的手法
推論 (小規模)	0.001〜0.01 kWh	0.5〜5 g-CO2	1日数万〜数百万回	大 (累積)	モデル選択・量子化・キャッシュ
推論 (大規模)	0.01〜0.1 kWh	5〜50 g-CO2	1日数百万〜数千万回	最大	バッチ処理・SLM切り替え

企業としては、推論段階の最適化がコスト削減と環境負荷軽減を同時に実現する最も費用対効果の高い施策となる。

環境負荷を削減する7つのアプローチ

環境負荷削減の施策は、モデル選択・実装・インフラの3層で考えるとわかりやすい。以下に効果とコストを整理した。

アプローチ	CO2削減効果	実装コスト	性能への影響	導入容易性
1. SLM・小型モデルの活用	大 (最大90%削減)	低	タスク依存 (単純タスクは遜色なし)	高 (API切替のみ)
2. 量子化 (INT8/INT4)	中〜大 (30〜75%削減)	低〜中	軽微 (0〜3%の精度低下)	中
3. バッチ処理	中 (20〜50%削減)	低	なし	高
4. 推論キャッシュ	中 (繰り返し処理で大)	低	なし	高
5. グリーンエネルギーDC選択	大 (電力CO2係数を削減)	中 (DC選択・移行)	なし	中
6. 効率的なアーキテクチャ	大 (モデル設計段階)	高 (開発コスト)	軽微または改善	低 (自社開発時のみ)
7. カーボンオフセット	実質的に大 (残余分を相殺)	中〜高	なし	中 (調達次第)

すぐに実施できる最も効果的な施策は「SLM・小型モデルの活用」と「バッチ処理」の組み合わせだ。全てのユースケースに最大のモデルを使う必要はない。タスクの複雑さに応じてモデルサイズを使い分けるだけで、推論コストとCO2排出量の大幅削減が可能になる。

企業のサステナブルAI戦略

AI関連のカーボンフットプリントを可視化・管理することは、ESG報告の観点からも重要性が増している。まず自社のAI推論がどれだけのCO2を排出しているかを測定することが出発点だ。

from codecarbon import EmissionsTracker
import anthropic

# AI推論のCO2排出量を計測する例
tracker = EmissionsTracker(
    project_name="llm-inference",
    country_iso_code="JPN",
    output_dir="./emissions_log"
)

client = anthropic.Anthropic()

tracker.start()
response = client.messages.create(
    model="claude-3-5-haiku-20241022",
    max_tokens=1024,
    messages=[{"role": "user", "content": "AIの環境負荷を教えてください"}]
)
emissions = tracker.stop()

print(f"CO2排出量: {emissions:.6f} kg-CO2eq")
print(f"電力消費: {tracker.final_emissions_data.energy_consumed:.6f} kWh")

ESGレポートへのAI関連CO2の開示は、現時点では任意だが義務化の方向で議論が進んでいる。先行してカーボンフットプリントの測定体制を整えておくことが、将来の規制対応コストを低減する。

業界動向と規制の方向性

EU AI Actでは、一部のAIシステムに対してエネルギー消費と資源効率の開示義務が盛り込まれている (2026年4月時点では段階的施行中)。特に「高リスクAI」に分類されるシステムは、エネルギー消費量の文書化が求められる。

主要クラウドプロバイダのグリーンエネルギーへの取り組みも加速している。GoogleはCarbon-Free Energy (CFE) スコアを公開し、Microsoft、AWSも再生可能エネルギー100%を目標に掲げている。AI推論を外部クラウドで行う場合、どのリージョンのデータセンターを選ぶかによって実質的なCO2排出量が数倍の差になることも珍しくない。

まとめ――AIの恩恵と環境負荷のバランスを取る

LLMの環境負荷は学習段階より推論段階の累積が大きい
SLMへの切り替えとバッチ処理が最もコスパの良い削減策
グリーンエネルギーのデータセンター選択で実質CO2排出量を大きく削減できる
ESGレポートへのAI関連CO2開示は義務化に向かっており、今から測定体制を整えることが重要

DE-STKでは、AI推論コストの最適化とサステナブルAI戦略の策定を包括的に支援しています。ご相談はお気軽にどうぞ。

よくある質問

Q. LLMの学習にはどのくらいのCO2が排出されますか?

GPT-3 (175Bパラメータ) の学習では約552トンのCO2が排出されたと推定されています。GPT-4クラスではさらに大きいと推測されますが、正確な数値は非公開です。一般的な乗用車の年間排出量 (約4トン) の100倍以上に相当します。

Q. AIの利用は環境に悪いのですか?

一概には言えません。AIの推論にはエネルギーを消費しますが、AIによる業務効率化が従来の非効率なプロセスのエネルギー消費を削減する効果もあります。重要なのは、不必要な推論の削減、効率的なモデル選択、グリーンエネルギーの活用でバランスを取ることです。

Q. 企業がAIの環境負荷を管理するにはどうすればよいですか?

AI推論のカーボンフットプリント測定ツール (codecarbon等) の導入、効率的なモデルの選択 (不要に大きなモデルを使わない)、グリーンエネルギーを使用するデータセンターの選択が基本です。ESGレポートへのAI関連CO2排出量の開示も求められる方向にあります。