Fivetranとは、300以上のコネクタを使ってSaaS・データベース・ファイルソースからクラウドDWHへのデータ連携を自動化するフルマネージドELTプラットフォームです。スキーマ変更の自動追従・増分同期・エラーハンドリングまで面倒を見てくれるため、データエンジニアが「SaaS APIを叩くスクリプトを保守する仕事」から解放されます。代わりに支払うのがMAR(月間アクティブ行数)ベースの従量課金で、コスト設計には最低限の知識が求められます。本記事ではFivetranの仕組み、コネクタの仕組み、料金モデル、そしてdbtとの組み合わせ方までを整理します。

Fivetranとは何か――「コネクタの王様」

Fivetranは2012年創業の米企業で、「データ連携の配管工事を自動化する」ことに特化したELT製品を提供しています。2024年時点で300を超えるコネクタを保持しており、Salesforce・HubSpot・Marketo・Stripe・Google Analytics 4・Shopifyといった主要SaaSから、PostgreSQL・MySQLのCDC、S3やGCS上のファイルまで幅広くサポートします。

ELTアーキテクチャにおけるFivetranの役割は「EL(Extract & Load)」です。生データをそのままDWHに投入し、変換(T)はdbtなどに任せる思想で設計されています。ベンダー側がスキーマ変更・API変更・増分同期の最適化まで面倒を見てくれるため、ユーザーはコネクタを「設定するだけ」で利用開始できます。

Fivetranの仕組み

Fivetranのデータフローはシンプルです。ソースシステムからAPIやCDCでデータを取得し、Fivetranの処理基盤で正規化したうえで、接続先のDWHにテーブルとして書き込みます。

【Fivetranのデータフロー】

[Salesforce]  -->  +------------------+
[HubSpot]     -->  |                  |
[Stripe]      -->  |   Fivetran       |  -->  [Snowflake]
[GA4]         -->  |   (Ingestion     |  -->  [BigQuery]
[PostgreSQL]  -->  |    Platform)     |  -->  [Redshift]
[S3/GCS]      -->  |                  |
                   +------------------+

   初回フルロード --> 以降は増分同期(CDC/更新日時/トリガ)

※ スキーマ変更は自動追従。新カラム追加もユーザー操作不要

初回は対象テーブルを全件ロードしますが、2回目以降は差分のみを同期する「増分同期」で動作します。差分の検出方法はソースの種類によって異なり、CDC(Change Data Capture)が使えるデータベースではWALやバイナリログを、SaaSではAPIの更新日時カラムやイベントフィードを活用します。

Fivetranが生成するスキーマは規則的です。ソーススキーマ名をプレフィックスに持ち、ソーステーブル名と同じ名前でDWHに作成されます。例えばSalesforceコネクタなら以下のような構造です。

-- Fivetranが生成したSalesforceテーブル例
select
    id, name, email, created_date, _fivetran_synced
from salesforce.contact
where _fivetran_deleted = false;

_fivetran_syncedと_fivetran_deletedというメタデータカラムが自動付与される点が特徴です。論理削除の管理も透過的に行われます。

主要なコネクタと対応DWH

Fivetranのコネクタは大きく3カテゴリに分かれます。SaaSコネクタ、データベースコネクタ、ファイルコネクタです。以下の表で代表例をまとめます。

カテゴリコネクタ例同期方式増分対応
SaaS(CRM/マーケ)Salesforce、HubSpot、Marketo、PardotREST APIあり
SaaS(広告/解析)Google Analytics 4、Google Ads、Meta AdsREST APIあり
SaaS(決済/EC)Stripe、Shopify、NetSuiteREST API / Webhookあり
データベースPostgreSQL、MySQL、SQL Server、OracleCDC(WAL/Binlog)あり
ファイルS3、GCS、Azure Blobファイル検知あり(新規/更新)
イベントSegment、AmplitudeEvent Streamあり

対応するDWHはSnowflake・BigQuery・Redshift・Databricksが主要4社で、最近ではAzure Synapseや一部のデータレイクにも対応が広がっています。日本リージョン(東京)のDWHにも同期できるため、データ主権の要件にも対応可能です。

料金モデルの理解

Fivetranの料金はMAR(Monthly Active Rows)という独自単位で計算されます。ざっくり言うと「その月にFivetranが処理した一意な行数」です。同じ行が月内で何度更新されても1 MARとしてカウントされるため、頻繁に更新される少量のテーブルは意外に安く、巨大な静的テーブルはコストが跳ねる、という特性があります。

プランはStarter / Standard / Enterprise の3層で、上位プランになるほど同期頻度・コネクタ数・サポート水準が強化されます。コスト最適化の基本は「使っていないテーブル・カラムを同期しない」ことです。Fivetranダッシュボードで不要な列を除外設定するだけでMARを削減できます。

プランMAR上限コネクタ数同期頻度サポート月額目安
Starter〜500万MAR程度主要SaaS/DB1時間ごとメール数万〜十数万円
Standard数千万MAR全コネクタ15分ごとチャット十数万〜数十万円
Enterprise上限なし全コネクタ+Priority5分ごと/リアルタイム24/7電話要見積もり

実際の料金はMARの使用量と同期頻度に応じた従量課金で、記載の月額は目安です。無料トライアルで自社データの実MARを測定してから正式契約するのが定石です。

Fivetranのメリットと注意点

Fivetranを採用する前に、光と影の両方を確認しておきましょう。

項目メリット注意点
運用負荷メンテナンスフリー。コネクタ側の仕様変更に自動追従トラブル時の内部ログが限定的
開発スピード数分で接続完了。試行錯誤が早いカスタム変換は別ツール(dbt等)必須
スキーマ管理スキーマ変更を自動反映意図しない列追加で下流がエラーになることも
コスト少量SaaSなら月数万円から始められるデータ量増で想定超過の請求が発生しうる
信頼性大手SaaS/DBコネクタは品質が安定マイナーコネクタは品質のばらつきあり

Fivetran + dbtの黄金コンビ

Fivetranは「EL」を担うツールであり、データ変換はdbtに任せるのが業界の定番構成です。Fivetranが生データをDWHに投入し、dbtがそれをstaging → intermediate → martの3層で整形する流れは、モダンデータスタックの王道パターンと言って差し支えありません。

FivetranはdbtプロジェクトのテンプレートをコネクタごとにOSSで公開しています(Fivetran dbt packages)。これをimportするだけで、Salesforce・HubSpot・Stripeといった主要SaaSの標準的な分析モデルを即座に立ち上げられます。

-- models/staging/stg_salesforce_contact.sql
select
    id as contact_id,
    email,
    created_date::date as created_at,
    is_deleted
from {{ source('salesforce', 'contact') }}
where _fivetran_deleted = false

Fivetran Transformationsという、dbtをFivetran側からスケジュールする連携機能も存在します。外部オーケストレーションを持たない小規模チームには便利な選択肢です。

まとめ――Fivetranは「データ連携の手間を消す」ツール

本記事の要点を振り返ります。

  • Fivetranは300+コネクタを持つフルマネージドELTプラットフォーム
  • スキーマ変更自動追従・増分同期・エラーハンドリングが魅力
  • 料金はMARベースの従量課金。無料トライアルで実測が必須
  • dbtとの組み合わせが業界標準。dbt packagesで即着手できる
  • 少量SaaS連携のROIが高く、データ量が増えるほどコスト管理が重要

次に読むべき記事は、OSSのAirbyteとの比較、dbt入門、そしてモダンデータスタックの全体像です。DE-STKではFivetran導入時のコネクタ選定・MAR試算・dbt連携設計を一括支援しています。費用対効果の見極めや既存ETL基盤からの移行相談もお気軽にどうぞ。

よくある質問(FAQ)

Q. Fivetranの料金はどのくらいかかりますか?

A. MAR(月間アクティブ行数)ベースの従量課金で、小規模なら月額数万円から利用可能です。データ量の増加に伴いコストも増えるため、不要テーブルの同期停止などの最適化が重要です。

Q. FivetranとAirbyteの違いは何ですか?

A. Fivetranは商用のフルマネージドサービスで運用負荷が極めて低い一方、Airbyteはオープンソースでセルフホスト可能なためコスト面で有利です。コネクタの品質・数はFivetranが優位です。

Q. Fivetranだけでデータ変換もできますか?

A. 簡易的な変換機能(Fivetran Transformations)はありますが、本格的な変換にはdbtとの組み合わせが推奨です。Fivetranは「EL」、dbtが「T」を担う構成がベストプラクティスです。