「データ基盤は高い」という誤解を今日でやめましょう。結論から申し上げると、BigQuery + Airbyte OSS + dbt Core + Metabaseの組み合わせなら月額10万円台――工夫次第では数千円から――でデータ基盤を立ち上げられます。本記事では1週間で完成させる構築ステップと、スケールアップの判断基準までを解説します。

「まず始める」ことが最重要――完璧な設計は後からでいい

データ基盤の導入で最もよくある失敗は「構想段階で止まる」ことです。3ヶ月かけて要件定義しても、動くものが出てこないプロジェクトに組織は待ってくれません。まず1週間で「動くもの」を作り、そこから改善を重ねる――この順序でなければ、データ基盤は形になりません。

スモールスタートは「安物買い」ではありません。小さく始めてスケールアップするパスが確立されているアーキテクチャを選ぶという、極めて戦略的な意思決定です。

月額10万円台の推奨構成

2026年時点の推奨構成は次の通りです。構成要素を図で示します。

【スモールスタート推奨構成】

[Sources]                [Ingestion]          [DWH]           [Transform]     [BI]
SaaS / RDB --->  Airbyte OSS  --->  BigQuery  --->  dbt Core  --->  Metabase
(Stripe / GA4)   (Docker)          (Free + $5/TB)  (OSS)           (OSS)

※ すべてOSSまたは従量課金のクラウドで構成。
※ 運用サーバーは小さなVM 1台で十分。

各コンポーネントのコストを詳しく見ていきましょう。

ツール月額目安役割
BigQuery無料〜2万円クラウドDWH。保存10GB・クエリ1TB/月まで無料
Airbyte OSS0円(VM代のみ)各SaaSからBigQueryへデータ取り込み
dbt Core0円SQLでデータ変換、テスト、ドキュメント生成
Metabase OSS0円(VM代のみ)BIダッシュボード
GCE小型VM(運用サーバー)5,000〜10,000円Airbyte / Metabase / Airflowをホスト
Cloud Composer(Airflow)※任意3〜5万円オーケストレーション
合計目安1〜15万円規模に応じて変動

運用サーバー上でAirbyteとMetabaseを起動するdocker-compose.ymlの概要を示します。

version: "3"
services:
  airbyte-webapp:
    image: airbyte/webapp:latest
    ports:
      - "8000:80"
  airbyte-server:
    image: airbyte/server:latest
    depends_on:
      - airbyte-db
  airbyte-db:
    image: postgres:13
    environment:
      POSTGRES_PASSWORD: airbyte
  metabase:
    image: metabase/metabase:latest
    ports:
      - "3000:3000"

構築ステップ(1週間プラン)

1週間で動くデータ基盤を作るプランです。初日から詰まらないよう、各日の成果物を明確にしました。

Day 1〜2はBigQueryのセットアップです。GCPプロジェクトを作成し、BigQueryを有効化、サービスアカウントを払い出します。Airbyte OSSを小型VM上にdocker-composeで立ち上げ、Stripe / Google Analytics / 自社RDBといった主要ソースからBigQueryへの接続を設定します。

Day 3〜4はdbtプロジェクトを作成します。`dbt init`でプロジェクトを初期化し、models/stagingディレクトリにstg_{source}__{table}.sqlを作ります。まずは2〜3個のstagingモデルとfct_orders、dim_customersを作ってみてください。`dbt run`で実行し、BigQueryに反映されることを確認します。

Day 5はMetabaseダッシュボードの構築です。MetabaseからBigQueryに接続し、日次売上、顧客数推移、オーダー内訳などのダッシュボードを作ります。この時点で「データ基盤がある」と呼べる状態に到達します。

Day 6〜7はテストと運用設計です。dbt testsでunique / not_nullテストを追加し、CIを設定し、Airbyteの同期頻度を日次に固定、Metabaseのアクセス権限を整理します。簡単なREADMEを書いて、引き継ぎ可能な状態にします。

スモールスタートの3つの原則

スモールスタートで失敗しないために押さえるべき原則が3つあります。

第一に「やりすぎない」ことです。初手でデータカタログ、オブザーバビリティ、リバースETLまで全部入れると、運用しきれず途中で止まります。最初はDWH + Ingestion + Transform + BIの4つだけに絞りましょう。

第二に「記録する」ことです。なぜこの構成にしたか、何を諦めたか、今後の拡張余地はどこか――こうした意思決定をREADMEかWiki 1枚に残しておくだけで、半年後の自分が救われます。

第三に「拡張を見据える」ことです。BigQuery→Snowflake、dbt Core→dbt Cloud、Metabase→Lookerといったスケールアップパスが確立された構成を選ぶことで、将来の移行コストを下げられます。

スケールアップのタイミング

いつスケールアップすべきかは、感覚ではなく指標で判断します。以下の閾値を超え始めたら次の一手を打ちましょう。

指標閾値次のアクション
BigQueryクエリ料金月額3万円超パーティショニング・クラスタリング見直し
データソース数10個超Fivetranへの移行検討
dbtモデル数100個超dbt Cloudへの移行検討
Metabaseユーザー数50名超Looker / Tableauへの移行検討
データ品質インシデント月4件超Elementary / Sodaの導入
運用チームの負荷専任1名超SaaS化で運用負荷を削減

よくある失敗

スモールスタートでよく見る失敗を3つ紹介します。まず「最初から完璧を目指す」失敗。データモデリングを数ヶ月かけて設計し、動くものが出ない間にプロジェクトが失速するパターンです。動くものを1週間で作り、モデリングは運用しながら改善するのが正解です。

次に「ツールを入れすぎる」失敗。OSSは無料ですが、運用負荷はタダではありません。最初に入れるツールは4つまでに絞り、運用が回ってから順次追加しましょう。

最後に「ドキュメントを残さない」失敗。担当者の頭の中だけに知識がある状態は、退職1人で基盤が危うくなります。README1枚でも残す習慣を身につけましょう。

まとめ

データ基盤のスモールスタートは、月額10万円台から、1週間で立ち上げられます。BigQuery + Airbyte OSS + dbt Core + Metabaseという王道構成なら、将来のスケールアップパスも確保されています。まず動くものを作り、使われる中で改善する――これが成功する唯一の方法です。

よくある質問

データ基盤を最安で始めるにはいくら必要ですか?

BigQueryの無料枠 + dbt Core(無料)+ Metabase OSS(無料)なら、サーバー費用のみで月額数千円から始められます。Airbyte OSSを追加しても月額1〜2万円程度です。データ量が小さいうちは実質ほぼ無料で運用できます。

スモールスタートからエンタープライズ規模にスケールできますか?

はい。BigQuery→Snowflakeへの移行やMetabase→Lookerへの移行パスが確立されており、段階的にスケールアップ可能です。スモールスタートの構成は将来の乗り換えコストが小さい点が利点です。

1人でデータ基盤は構築できますか?

スモールスタート構成なら1人で1週間程度で構築可能です。SQLの基礎知識とクラウドの基本操作ができれば十分です。躓きやすいのは初期のソース接続部分なので、そこだけは時間を見積もってください。