Fivetranとは、300以上のコネクタを使ってSaaS・データベース・ファイルソースからクラウドDWHへのデータ連携を自動化するフルマネージドELTプラットフォームです。スキーマ変更の自動追従・増分同期・エラーハンドリングまで面倒を見てくれるため、データエンジニアが「SaaS APIを叩くスクリプトを保守する仕事」から解放されます。代わりに支払うのがMAR(月間アクティブ行数)ベースの従量課金で、コスト設計には最低限の知識が求められます。本記事ではFivetranの仕組み、コネクタの仕組み、料金モデル、そしてdbtとの組み合わせ方までを整理します。
Fivetranとは何か――「コネクタの王様」
Fivetranは2012年創業の米企業で、「データ連携の配管工事を自動化する」ことに特化したELT製品を提供しています。2024年時点で300を超えるコネクタを保持しており、Salesforce・HubSpot・Marketo・Stripe・Google Analytics 4・Shopifyといった主要SaaSから、PostgreSQL・MySQLのCDC、S3やGCS上のファイルまで幅広くサポートします。
ELTアーキテクチャにおけるFivetranの役割は「EL(Extract & Load)」です。生データをそのままDWHに投入し、変換(T)はdbtなどに任せる思想で設計されています。ベンダー側がスキーマ変更・API変更・増分同期の最適化まで面倒を見てくれるため、ユーザーはコネクタを「設定するだけ」で利用開始できます。
Fivetranの仕組み
Fivetranのデータフローはシンプルです。ソースシステムからAPIやCDCでデータを取得し、Fivetranの処理基盤で正規化したうえで、接続先のDWHにテーブルとして書き込みます。
【Fivetranのデータフロー】
[Salesforce] --> +------------------+
[HubSpot] --> | |
[Stripe] --> | Fivetran | --> [Snowflake]
[GA4] --> | (Ingestion | --> [BigQuery]
[PostgreSQL] --> | Platform) | --> [Redshift]
[S3/GCS] --> | |
+------------------+
初回フルロード --> 以降は増分同期(CDC/更新日時/トリガ)
※ スキーマ変更は自動追従。新カラム追加もユーザー操作不要
初回は対象テーブルを全件ロードしますが、2回目以降は差分のみを同期する「増分同期」で動作します。差分の検出方法はソースの種類によって異なり、CDC(Change Data Capture)が使えるデータベースではWALやバイナリログを、SaaSではAPIの更新日時カラムやイベントフィードを活用します。
Fivetranが生成するスキーマは規則的です。ソーススキーマ名をプレフィックスに持ち、ソーステーブル名と同じ名前でDWHに作成されます。例えばSalesforceコネクタなら以下のような構造です。
-- Fivetranが生成したSalesforceテーブル例
select
id, name, email, created_date, _fivetran_synced
from salesforce.contact
where _fivetran_deleted = false;
_fivetran_syncedと_fivetran_deletedというメタデータカラムが自動付与される点が特徴です。論理削除の管理も透過的に行われます。
主要なコネクタと対応DWH
Fivetranのコネクタは大きく3カテゴリに分かれます。SaaSコネクタ、データベースコネクタ、ファイルコネクタです。以下の表で代表例をまとめます。
| カテゴリ | コネクタ例 | 同期方式 | 増分対応 |
|---|---|---|---|
| SaaS(CRM/マーケ) | Salesforce、HubSpot、Marketo、Pardot | REST API | あり |
| SaaS(広告/解析) | Google Analytics 4、Google Ads、Meta Ads | REST API | あり |
| SaaS(決済/EC) | Stripe、Shopify、NetSuite | REST API / Webhook | あり |
| データベース | PostgreSQL、MySQL、SQL Server、Oracle | CDC(WAL/Binlog) | あり |
| ファイル | S3、GCS、Azure Blob | ファイル検知 | あり(新規/更新) |
| イベント | Segment、Amplitude | Event Stream | あり |
対応するDWHはSnowflake・BigQuery・Redshift・Databricksが主要4社で、最近ではAzure Synapseや一部のデータレイクにも対応が広がっています。日本リージョン(東京)のDWHにも同期できるため、データ主権の要件にも対応可能です。
料金モデルの理解
Fivetranの料金はMAR(Monthly Active Rows)という独自単位で計算されます。ざっくり言うと「その月にFivetranが処理した一意な行数」です。同じ行が月内で何度更新されても1 MARとしてカウントされるため、頻繁に更新される少量のテーブルは意外に安く、巨大な静的テーブルはコストが跳ねる、という特性があります。
プランはStarter / Standard / Enterprise の3層で、上位プランになるほど同期頻度・コネクタ数・サポート水準が強化されます。コスト最適化の基本は「使っていないテーブル・カラムを同期しない」ことです。Fivetranダッシュボードで不要な列を除外設定するだけでMARを削減できます。
| プラン | MAR上限 | コネクタ数 | 同期頻度 | サポート | 月額目安 |
|---|---|---|---|---|---|
| Starter | 〜500万MAR程度 | 主要SaaS/DB | 1時間ごと | メール | 数万〜十数万円 |
| Standard | 数千万MAR | 全コネクタ | 15分ごと | チャット | 十数万〜数十万円 |
| Enterprise | 上限なし | 全コネクタ+Priority | 5分ごと/リアルタイム | 24/7電話 | 要見積もり |
実際の料金はMARの使用量と同期頻度に応じた従量課金で、記載の月額は目安です。無料トライアルで自社データの実MARを測定してから正式契約するのが定石です。
Fivetranのメリットと注意点
Fivetranを採用する前に、光と影の両方を確認しておきましょう。
| 項目 | メリット | 注意点 |
|---|---|---|
| 運用負荷 | メンテナンスフリー。コネクタ側の仕様変更に自動追従 | トラブル時の内部ログが限定的 |
| 開発スピード | 数分で接続完了。試行錯誤が早い | カスタム変換は別ツール(dbt等)必須 |
| スキーマ管理 | スキーマ変更を自動反映 | 意図しない列追加で下流がエラーになることも |
| コスト | 少量SaaSなら月数万円から始められる | データ量増で想定超過の請求が発生しうる |
| 信頼性 | 大手SaaS/DBコネクタは品質が安定 | マイナーコネクタは品質のばらつきあり |
Fivetran + dbtの黄金コンビ
Fivetranは「EL」を担うツールであり、データ変換はdbtに任せるのが業界の定番構成です。Fivetranが生データをDWHに投入し、dbtがそれをstaging → intermediate → martの3層で整形する流れは、モダンデータスタックの王道パターンと言って差し支えありません。
FivetranはdbtプロジェクトのテンプレートをコネクタごとにOSSで公開しています(Fivetran dbt packages)。これをimportするだけで、Salesforce・HubSpot・Stripeといった主要SaaSの標準的な分析モデルを即座に立ち上げられます。
-- models/staging/stg_salesforce_contact.sql
select
id as contact_id,
email,
created_date::date as created_at,
is_deleted
from {{ source('salesforce', 'contact') }}
where _fivetran_deleted = false
Fivetran Transformationsという、dbtをFivetran側からスケジュールする連携機能も存在します。外部オーケストレーションを持たない小規模チームには便利な選択肢です。
まとめ――Fivetranは「データ連携の手間を消す」ツール
本記事の要点を振り返ります。
- Fivetranは300+コネクタを持つフルマネージドELTプラットフォーム
- スキーマ変更自動追従・増分同期・エラーハンドリングが魅力
- 料金はMARベースの従量課金。無料トライアルで実測が必須
- dbtとの組み合わせが業界標準。dbt packagesで即着手できる
- 少量SaaS連携のROIが高く、データ量が増えるほどコスト管理が重要
次に読むべき記事は、OSSのAirbyteとの比較、dbt入門、そしてモダンデータスタックの全体像です。DE-STKではFivetran導入時のコネクタ選定・MAR試算・dbt連携設計を一括支援しています。費用対効果の見極めや既存ETL基盤からの移行相談もお気軽にどうぞ。
よくある質問(FAQ)
Q. Fivetranの料金はどのくらいかかりますか?
A. MAR(月間アクティブ行数)ベースの従量課金で、小規模なら月額数万円から利用可能です。データ量の増加に伴いコストも増えるため、不要テーブルの同期停止などの最適化が重要です。
Q. FivetranとAirbyteの違いは何ですか?
A. Fivetranは商用のフルマネージドサービスで運用負荷が極めて低い一方、Airbyteはオープンソースでセルフホスト可能なためコスト面で有利です。コネクタの品質・数はFivetranが優位です。
Q. Fivetranだけでデータ変換もできますか?
A. 簡易的な変換機能(Fivetran Transformations)はありますが、本格的な変換にはdbtとの組み合わせが推奨です。Fivetranは「EL」、dbtが「T」を担う構成がベストプラクティスです。