「データ基盤は高い」という誤解を今日でやめましょう。結論から申し上げると、BigQuery + Airbyte OSS + dbt Core + Metabaseの組み合わせなら月額10万円台――工夫次第では数千円から――でデータ基盤を立ち上げられます。本記事では1週間で完成させる構築ステップと、スケールアップの判断基準までを解説します。
「まず始める」ことが最重要――完璧な設計は後からでいい
データ基盤の導入で最もよくある失敗は「構想段階で止まる」ことです。3ヶ月かけて要件定義しても、動くものが出てこないプロジェクトに組織は待ってくれません。まず1週間で「動くもの」を作り、そこから改善を重ねる――この順序でなければ、データ基盤は形になりません。
スモールスタートは「安物買い」ではありません。小さく始めてスケールアップするパスが確立されているアーキテクチャを選ぶという、極めて戦略的な意思決定です。
月額10万円台の推奨構成
2026年時点の推奨構成は次の通りです。構成要素を図で示します。
【スモールスタート推奨構成】
[Sources] [Ingestion] [DWH] [Transform] [BI]
SaaS / RDB ---> Airbyte OSS ---> BigQuery ---> dbt Core ---> Metabase
(Stripe / GA4) (Docker) (Free + $5/TB) (OSS) (OSS)
※ すべてOSSまたは従量課金のクラウドで構成。
※ 運用サーバーは小さなVM 1台で十分。
各コンポーネントのコストを詳しく見ていきましょう。
| ツール | 月額目安 | 役割 |
|---|---|---|
| BigQuery | 無料〜2万円 | クラウドDWH。保存10GB・クエリ1TB/月まで無料 |
| Airbyte OSS | 0円(VM代のみ) | 各SaaSからBigQueryへデータ取り込み |
| dbt Core | 0円 | SQLでデータ変換、テスト、ドキュメント生成 |
| Metabase OSS | 0円(VM代のみ) | BIダッシュボード |
| GCE小型VM(運用サーバー) | 5,000〜10,000円 | Airbyte / Metabase / Airflowをホスト |
| Cloud Composer(Airflow)※任意 | 3〜5万円 | オーケストレーション |
| 合計目安 | 1〜15万円 | 規模に応じて変動 |
運用サーバー上でAirbyteとMetabaseを起動するdocker-compose.ymlの概要を示します。
version: "3"
services:
airbyte-webapp:
image: airbyte/webapp:latest
ports:
- "8000:80"
airbyte-server:
image: airbyte/server:latest
depends_on:
- airbyte-db
airbyte-db:
image: postgres:13
environment:
POSTGRES_PASSWORD: airbyte
metabase:
image: metabase/metabase:latest
ports:
- "3000:3000"
構築ステップ(1週間プラン)
1週間で動くデータ基盤を作るプランです。初日から詰まらないよう、各日の成果物を明確にしました。
Day 1〜2はBigQueryのセットアップです。GCPプロジェクトを作成し、BigQueryを有効化、サービスアカウントを払い出します。Airbyte OSSを小型VM上にdocker-composeで立ち上げ、Stripe / Google Analytics / 自社RDBといった主要ソースからBigQueryへの接続を設定します。
Day 3〜4はdbtプロジェクトを作成します。`dbt init`でプロジェクトを初期化し、models/stagingディレクトリにstg_{source}__{table}.sqlを作ります。まずは2〜3個のstagingモデルとfct_orders、dim_customersを作ってみてください。`dbt run`で実行し、BigQueryに反映されることを確認します。
Day 5はMetabaseダッシュボードの構築です。MetabaseからBigQueryに接続し、日次売上、顧客数推移、オーダー内訳などのダッシュボードを作ります。この時点で「データ基盤がある」と呼べる状態に到達します。
Day 6〜7はテストと運用設計です。dbt testsでunique / not_nullテストを追加し、CIを設定し、Airbyteの同期頻度を日次に固定、Metabaseのアクセス権限を整理します。簡単なREADMEを書いて、引き継ぎ可能な状態にします。
スモールスタートの3つの原則
スモールスタートで失敗しないために押さえるべき原則が3つあります。
第一に「やりすぎない」ことです。初手でデータカタログ、オブザーバビリティ、リバースETLまで全部入れると、運用しきれず途中で止まります。最初はDWH + Ingestion + Transform + BIの4つだけに絞りましょう。
第二に「記録する」ことです。なぜこの構成にしたか、何を諦めたか、今後の拡張余地はどこか――こうした意思決定をREADMEかWiki 1枚に残しておくだけで、半年後の自分が救われます。
第三に「拡張を見据える」ことです。BigQuery→Snowflake、dbt Core→dbt Cloud、Metabase→Lookerといったスケールアップパスが確立された構成を選ぶことで、将来の移行コストを下げられます。
スケールアップのタイミング
いつスケールアップすべきかは、感覚ではなく指標で判断します。以下の閾値を超え始めたら次の一手を打ちましょう。
| 指標 | 閾値 | 次のアクション |
|---|---|---|
| BigQueryクエリ料金 | 月額3万円超 | パーティショニング・クラスタリング見直し |
| データソース数 | 10個超 | Fivetranへの移行検討 |
| dbtモデル数 | 100個超 | dbt Cloudへの移行検討 |
| Metabaseユーザー数 | 50名超 | Looker / Tableauへの移行検討 |
| データ品質インシデント | 月4件超 | Elementary / Sodaの導入 |
| 運用チームの負荷 | 専任1名超 | SaaS化で運用負荷を削減 |
よくある失敗
スモールスタートでよく見る失敗を3つ紹介します。まず「最初から完璧を目指す」失敗。データモデリングを数ヶ月かけて設計し、動くものが出ない間にプロジェクトが失速するパターンです。動くものを1週間で作り、モデリングは運用しながら改善するのが正解です。
次に「ツールを入れすぎる」失敗。OSSは無料ですが、運用負荷はタダではありません。最初に入れるツールは4つまでに絞り、運用が回ってから順次追加しましょう。
最後に「ドキュメントを残さない」失敗。担当者の頭の中だけに知識がある状態は、退職1人で基盤が危うくなります。README1枚でも残す習慣を身につけましょう。
まとめ
データ基盤のスモールスタートは、月額10万円台から、1週間で立ち上げられます。BigQuery + Airbyte OSS + dbt Core + Metabaseという王道構成なら、将来のスケールアップパスも確保されています。まず動くものを作り、使われる中で改善する――これが成功する唯一の方法です。
よくある質問
データ基盤を最安で始めるにはいくら必要ですか?
BigQueryの無料枠 + dbt Core(無料)+ Metabase OSS(無料)なら、サーバー費用のみで月額数千円から始められます。Airbyte OSSを追加しても月額1〜2万円程度です。データ量が小さいうちは実質ほぼ無料で運用できます。
スモールスタートからエンタープライズ規模にスケールできますか?
はい。BigQuery→Snowflakeへの移行やMetabase→Lookerへの移行パスが確立されており、段階的にスケールアップ可能です。スモールスタートの構成は将来の乗り換えコストが小さい点が利点です。
1人でデータ基盤は構築できますか?
スモールスタート構成なら1人で1週間程度で構築可能です。SQLの基礎知識とクラウドの基本操作ができれば十分です。躓きやすいのは初期のソース接続部分なので、そこだけは時間を見積もってください。