Einrichten der Datenaufnahme für Ihren Snowflake Connector for Google Analytics Raw Data

Der Snowflake Connector für Google Analytics Raw Data unterliegt den Nutzungsbedingungen für Konnektoren.

Unter diesem Thema wird beschrieben, wie Sie in Ihrem Snowflake-Konto auf den Snowflake Connector for Google Analytics Raw Data zugreifen.

Bemerkung

Jede einzelne Eigenschaft kann immer nur von einem GCP-Projekt aufgenommen werden. Das Ändern des Projekts für eine zuvor konfigurierte Eigenschaft erfordert derzeit eine Neuinstallation des Konnektors. Diese Einschränkung wird es in Zukunft nicht mehr geben.

Wenn Sie die Exporteinstellungen für eine Eigenschaft ändern und diese in ein anderes GCP-Projekt exportieren, sollten Sie auch die Daten aus der vorherigen BigQuery-Instanz manuell verschieben und in der neu konfigurierten Instanz konsolidieren.

Einrichten der Datenaufnahme mit Snowsight

Um die Datenaufnahme mit Snowsight einzurichten, gehen Sie wie folgt vor:

  1. Melden Sie sich bei Snowsight als Benutzer mit der Rolle ACCOUNTADMIN an.

  2. Wählen Sie im Navigationsmenü die Option Data Products » Apps aus.

  3. Suchen Sie nach dem Snowflake Connector for Google Analytics Raw Data, und wählen Sie dann die Kachel für den Konnektor aus.

  4. Navigieren Sie auf der Seite des Snowflake Connector for Google Analytics Raw Data zum Bereich Data Sync.

    Dadurch wird eine Liste aller Google Analytics-Eigenschaften angezeigt.

  5. Wählen Sie die Eigenschaften aus, die Sie aufnehmen möchten:

    1. Suchen Sie nach der Eigenschaft, die Sie aufnehmen möchten.

    2. Aktivieren Sie das Kontrollkästchen in der Spalte Status neben der Eigenschaft, die Sie auswählen möchten.

    3. Wiederholen Sie diese Schritte für jede Eigenschaft, die Sie in Snowflake aufnehmen möchten.

  6. Wählen Sie die Überschrift der Spalte Status aus, um die aktuell ausgewählten Eigenschaften anzuzeigen.

  7. Wählen Sie Start sync aus, um mit der Datenaufnahme in Ihr Snowflake-Konto zu beginnen.

Die ausgewählten Eigenschaften werden in der Eigenschaftenliste angezeigt.

Der Data Ingestion-Status wird in der rechten oberen Ecke des Bereichs Manage data synchronization angezeigt.

Die Datensynchronisierung jeder Eigenschaft beginnt mit einem erstmaligen Laden. Dabei werden alle historischen Daten einer Eigenschaft erfasst und dann mit der aktuellen Synchronisierung fortgefahren. Wenn Sie nur aktuelle Daten synchronisieren möchten, können Sie dies über ein Arbeitsblatt tun.

Bemerkung

Sobald eine Eigenschaft mit erstmaligem Laden aktiviert ist, kann das erstmalige Laden deaktiviert werden. Wenn andererseits die Eigenschaft ohne erstmaligem Laden aktiviert wird, kann das erstmalige Laden später nicht mehr aktiviert werden.

Ändern der Datenaufnahme mit Snowsight

Um die aufzunehmenden Google Analytics-Tabellen oder den Synchronisierungszeitplan für die Tabellen zu ändern, gehen Sie wie folgt vor:

  1. Melden Sie sich bei Snowsight als Benutzer mit der Rolle ACCOUNTADMIN an.

  2. Wählen Sie im Navigationsmenü die Option Data Products » Apps aus.

  3. Suchen Sie nach dem Snowflake Connector for Google Analytics Raw Data, und wählen Sie dann die Kachel für den Konnektor aus.

  4. Navigieren Sie auf der Seite des Snowflake Connector for Google Analytics Raw Data zum Bereich Data Sync.

  5. Wählen Sie Edit properties aus.

  6. Ändern Sie die Tabellen, die Sie erfassen möchten:

    1. Suchen Sie nach der Tabelle, die Sie erfassen möchten.

    2. Aktivieren Sie das Kontrollkästchen in der Spalte Status neben der Tabelle, die Sie auswählen oder Auswahl entfernen möchten.

  7. Wählen Sie Update data sync aus.

Einrichten der Datenaufnahme mit SQL-Anweisungen

Um die Datenaufnahme mit SQL-Anweisungen einzurichten, gehen Sie wie folgt vor:

Bemerkung

Um diese Einstellungen zu konfigurieren, verwenden Sie gespeicherte Prozeduren, die im PUBLIC-Schema der Datenbank definiert sind, die als Instanz der Konnektorinstallationsdatenbank dient.

Bevor Sie diese gespeicherten Prozeduren aufrufen, wählen Sie diese Datenbank als die für die Sitzung zu verwendende Datenbank aus.

Wenn diese Datenbank beispielsweise snowflake_connector_for_google_analytics_raw_data heißt, führen Sie den folgenden Befehl aus:

USE DATABASE snowflake_connector_for_google_analytics_raw_data;
Copy

Anzeigen der für die Datenaufnahme verfügbaren Eigenschaften

Um alle verfügbaren Eigenschaften in einem bestimmten GCP-Projekt aufzulisten, rufen Sie die folgende gespeicherte Prozedur auf:

CALL LIST_GA_PROPERTIES();
Copy

Das Ergebnis zeigt alle Projekte und Eigenschaften an, die für eine Erfassung durch ein autorisiertes Konto verfügbar sind. Wenn keine Ergebnisse zurückgegeben werden, überprüfen Sie Folgendes:

  • Der Datenexport von Google Analytics nach BigQuery ist konfiguriert.

  • Die exportierten Daten sind in BigQuery sichtbar.

  • Dem verwendeten Dienstkonto bzw. dem authentifizierten Benutzer sind die korrekten Rollen zugewiesen.

Beachten Sie, dass zwischen Einrichten des Datenexports und Speichern der Daten in BigQuery bis zu 24 Stunden vergehen können. Diese Verzögerung kann eine Ursache dafür sein, dass die Prozedur LIST_GA_PROPERTIES keine Ergebnisse zurückgibt.

Wenn Sie den Google Analytics-Export deaktivieren, bedeutet dies nicht, dass die Eigenschaft von LIST_GA_PROPERTIES ausgelassen wird. Auch wenn der Export deaktiviert wurde, können die Daten in BigQuery bestehen bleiben und vom Konnektor synchronisiert werden.

Vorbereiten der Zieldatenbank

Bevor Sie die Datenaufnahme aktivieren, müssen Sie dem Konnektor Zugriff gewähren, um Tabellen und Ansichten in Ihrer Zieldatenbank und Ihrem Schema zu erstellen.

GRANT USAGE ON DATABASE <destination database> TO APPLICATION <application name>;

GRANT USAGE ON SCHEMA <destination database>.<destination schema> TO APPLICATION <application name>;

GRANT CREATE TABLE ON SCHEMA <destination database>.<destination schema> TO APPLICATION <application name>;

GRANT CREATE VIEW ON SCHEMA <destination database>.<destination schema> TO APPLICATION <application name>;
Copy

Aktivieren oder Deaktivieren der Datenaufnahme einer Eigenschaft

Um das Synchronisieren von Daten für eine bestimmte Tabelle in Google Analytics zu aktivieren oder zu deaktivieren, rufen Sie die gespeicherte Prozedur ENABLE_PROPERTIES mit den folgenden Argumenten auf:

CALL ENABLE_PROPERTIES('<gcp_project>', ['<properties_to_configure>'], <enable_initial_load>, <exclude_nulls>, <disable_auto_reloads>);
Copy

Wobei:

gcp_project

Gibt das GCP-Projekt der aktivierten Eigenschaften an.

properties_to_configure

Gibt eine durch Komma getrennte Liste der Namen von Google Analytics-Eigenschaften in einfachen Anführungszeichen an.

Verwenden Sie den Eigenschaftsnamen ohne das Präfix analytics_.

enable_initial_load

Ein boolescher Wert, der angibt, ob das erstmalige Laden von Daten aktiviert oder deaktiviert werden soll, wobei alle historischen Daten einer Eigenschaft aufgenommen werden und dann mit der aktuellen Synchronisierung fortgefahren wird.

Dies ist ein optionales Argument. Der Standardwert dafür ist true.

Wenn eine Eigenschaft zuvor aktiviert war, wird dieses Flag ignoriert und die Datenaufnahme wird an dem Punkt fortgesetzt, an dem sie unterbrochen wurde, als die Eigenschaft deaktiviert wurde.

exclude_nulls

Optionaler boolescher Wert, der angibt, ob Felder mit Nullwerten von den aufgenommenen Daten ausgeschlossen werden sollen. Die Einstellung dieses Parameters auf true kann den Durchsatz bei der Datenaufnahme verbessern. Der Standardwert ist false.

disable_auto_reloads

Ein optionaler boolescher Wert, der angibt, ob automatisches Neuladen deaktiviert werden sollte. Weitere Einzelheiten zum automatischen Nachladen finden Sie unter Datenaufnahmemodell des Snowflake Connector for Google Analytics Raw Data. Wenn Sie diesen Wert auf true einstellen, können Sie den Credit-Verbrauch reduzieren, aber verspätete Daten werden nicht in Snowflake aufgenommen. Der Standardwert ist false.

Um beispielsweise die Synchronisierung der Eigenschaften mit den Namen property1, property2 und property3 im Projekt gcp_example_project zu aktivieren, führen Sie den folgenden Befehl aus:

CALL ENABLE_PROPERTIES('gcp_example_project', ['property1','property2','property3']);
Copy

Um Eigenschaften ohne anfängliches Laden von Daten zu aktivieren, verwenden Sie eine ENABLE_PROPERITES-Abfrage ähnlich wie diese:

CALL ENABLE_PROPERTIES('gcp_example_project', ['property1','property2','property3'], false);
Copy

Sie können benannte Argumente verwenden, um bestimmte Argumente anzugeben und den Rest unverändert zu lassen. Um beispielsweise Eigenschaften beim ersten Laden zu aktivieren und Felder mit Nullwerten auszuschließen, führen Sie die folgende Abfrage aus:

 CALL ENABLE_PROPERTIES(
    PROJECT_ID => 'gcp_example_project',
    PROPERTY_IDS => ['property1', 'property2', 'property3'],
    INITIAL_LOAD => TRUE,
    EXCLUDE_NULLS => TRUE
);
Copy

Um zu verhindern, dass diese Eigenschaften aufgenommen werden, führen Sie den folgenden Befehl aus:

CALL DISABLE_PROPERTIES('gcp_example_project', ['property1','property2','property3']);
Copy

Durch das Deaktivieren der Eigenschaft wird die Synchronisierung gestoppt. Wenn das Synchronisieren der Eigenschaft deaktiviert ist, wird die gesamte begonnene Datenaufnahme aus der Zieldatenbank entfernt.

Die Prozedur ENABLE_PROPERTIES fügt die angegebenen Eigenschaftsnamen zur Ansicht ENABLED_PROPERTIES hinzu.

Erstmaliges Laden

Nach dem Aktivieren einer neuen Eigenschaft wechselt der Konnektor in den Modus für das erstmalige Laden. Dies bedeutet, dass erst alle in BigQuery gefundenen historischen Daten erfasst werden, bevor neue Ereignisse aufgenommen werden.

Erneutes Laden bereits aufgenommener Daten

Um bereits aufgenommene Daten erneut zu laden oder um Daten zu laden, die noch nicht aufgenommen wurden (z. B. weil Sie Eigenschaften aktiviert haben, ohne sie ursprünglich zu laden, oder weil Daten in BigQuery nicht vorhanden waren und jetzt verfügbar sind), können Sie eine der folgenden Prozeduren aufrufen:

CALL RELOAD_PROPERTY('<property id>');
Copy

Diese Prozedur löst das erneute Laden aller Daten (DAILY, INTRADAY, USERS und PSEUDONYMOUS_USERS) einer bestimmten Eigenschaft aus, zwischen der frühesten Tabelle, die sie in BigQuery finden kann, und dem Datum der letzten aufgenommenen (oder als DATA_NOT_FOUND abschließend markierten) Tabelle für den Konnektor.

CALL RELOAD_PROPERTY('<property id>', <first date>, <last date>);
Copy

Löst das erneute Laden aller Daten (DAILY, INTRADAY, USERS und PSEUDONYMOUS_USERS) einer bestimmten Eigenschaft zwischen den angegebenen Daten aus.

CALL RELOAD_PROPERTY('<property id>', '<export type>', <first date>, <last date>);
Copy

Löst das erneute Laden der Daten von DAILY, INTRADAY, USERS oder PSEUDONYMOUS_USERS für eine bestimmte Eigenschaft zwischen den angegebenen Daten aus.

Bemerkung

  • Das erneute Laden wird parallel zum Hauptladen verarbeitet.

  • Sie können eine Eigenschaft so oft neu laden, wie Sie möchten, solange sich die Datumsbereiche nicht überschneiden.

  • Die Daten werden nach dem Herunterladen der einzelnen Tabellen von BigQuery ausgetauscht.

  • Laden Sie die Daten nur dann neu, wenn für einen bestimmten Tag Daten in BigQuery vorhanden sind.

Laufendes Neuladen kann über eine spezielle Ansicht angezeigt werden:

SELECT * FROM PUBLIC.ONOGOING_RELOADS;
Copy

Führen Sie folgende Abfrage aus, um das laufende Neuladen abzubrechen:

CALL CANCEL_RELOAD_PROPERTY('<load id>');
Copy