Snowflake Connector for Google Analytics Raw Data のデータインジェスチョンモデル¶
このトピックでは、 Snowflake Connector for Google Analytics Raw Data がサポートするデータインジェスチョンモデルに関する情報を提供します。
Googleアナリティクスから BigQuery エクスポート¶
- Googleアナリティクスは2種類の BigQuery エクスポートをサポートしています:
毎日 - Googleアナリティクスは
events_XXXXXX
という名前のテーブルにデータをエクスポートします。テーブルは、その日のすべてのイベントが収集された後に1日1回作成されます。ストリーミング - Googleアナリティクスは1日中継続的にデータをエクスポートし、
events_intraday_XXXXXX
という名前のテーブルに保存します。
コネクタは両方のタイプのエクスポートをサポートし、日次か日中かに関係なく BigQuery で見つけたすべてのテーブルを自動的にダウンロードします。追加の構成は必要ありません。
シンクテーブル¶
各プロパティについて、コネクタはイベントをプロパティ固有のテーブルに保存します。このテーブルは、コネクタ構成で提供されるデータベースとスキーマに作成されます。各プロパティに対して、2つのテーブルが作成されます。1つは日次エクスポート用、もう1つは日中エクスポート用で、それぞれ ANALYTICS_XXXXXXXXX
と ANALYTICS_INTRADAY_XXXXXXXXX
という名前です。Googleアナリティクスで両方のタイプのエクスポートが設定されている場合、コネクタは両方のテーブルをインジェストします。日中テーブルが先で、その後に日次テーブルです。
日次のデータインジェスチョン¶
コネクタは、テーブルが BigQuery に存在することを認識すると、1回の実行でテーブル全体をダウンロードします。一度ダウンロードされたテーブルは、今後の処理で再検討されません。Googleは、日次テーブルの更新はテーブルが作成されてから最大72時間後まで可能であることを警告しています。現在のバージョンのコネクタは、この種の更新をシンクテーブルに反映することをサポートしていません。
日中のインジェスト¶
このコネクタは、過去の日中テーブル(BigQuery に存在する場合)のダウンロードと、現在も更新を受けている日中テーブルの継続的なインジェストをサポートします。
過去日については、コネクタは日中テーブルを日次テーブルと同じ方法でダウンロードします。全体として各テーブルをダウンロードし、現在の日付のデータに到達するまで1度に1つのテーブルをダウンrロードします。
コネクタは、日中テーブルが BigQuery 内の最後のテーブルであることを認識すると、テーブルの増分処理を開始します。つまり、一日中、一定の間隔(デフォルトでは8時間)で、テーブルから受信データのバッチをダウンロードします。
以下のいずれかに該当する場合:
翌日のテーブルが BigQuery データセットに表示されました
指定されたテーブルの最初のロードから24時間が経過
コネクタは指定された日中テーブルの最終インジェストを行い、次のインジェストに切り替わります。
注釈
少ない数のイベントはインジェストされません。これは、10分以上遅延したイベントに関するものである。今度の機能はこの問題を解決できるようになります。
より頻繁な更新が必要な場合は、 CONFIGURE_INGESTION_INTERVAL を使用してデフォルトの間隔値を変更します。