Governança de custos do Snowflake Connector for Google Analytics Raw Data

O Snowflake Conector para o Google Analytics Raw Data está sujeito aos Termos do conector.

Este tópico fornece as práticas recomendadas para controle de custos e localização do tamanho de warehouse ideal para o Snowflake Connector for Google Analytics Raw Data.

Como medir o custo do conector

Se o conector tiver uma conta separada apenas para ingestão e armazenamento de dados e a conta não mostrar nenhuma outra atividade (como a execução de consultas por usuários usando os dados ingeridos), você poderá ler o custo geral no nível da conta. Para saber mais, consulte Exploração do custo total.

Se a conta não for dedicada apenas ao conector ou você precisar investigar mais os custos, analise separadamente os custos cobrados pelos componentes:

Para obter uma introdução a esses três componentes de custo, consulte Compreensão do custo total.

Recomendações gerais

Para determinar os custos gerados pelo conector, você pode criar uma conta separada exclusivamente para o conector. Usar uma conta específica permite que você rastreie a transferência exata de dados gerada pelo conector.

Se você não puder usar uma conta separada para o conector, considere as seguintes opções:

  • Para rastrear o custo de armazenamento mais facilmente, crie um banco de dados separado para armazenar dados ingeridos.

  • Para determinar os custos de computação exatos, aloque um warehouse somente para o conector.

  • Para criar relatórios de custos personalizados, use tags de objeto nos bancos de dados e no warehouse.

Custo de computação

Recomendamos que você crie um warehouse dedicado apenas para o conector. Esta configuração permite criar monitores de recursos no warehouse. Você pode usar os monitores para enviar alertas de e-mail e suspender o warehouse, parando o conector quando a cota de crédito definida for excedida. O conector é retomado automaticamente após a renovação da cota de crédito. Observe que definir uma cota de crédito muito baixa nas configurações, quando grandes volumes de dados são ingeridos, pode impedir que o conector realize a ingestão de todos os dados. Um grande benefício é que o tamanho do warehouse pode ser ajustado ao volume de dados.

Para obter mais informações sobre como verificar os créditos consumidos pelo warehouse, consulte Explorando o custo de computação. Você também pode atribuir tags de objeto ao warehouse e usar as tags para criar relatórios de custos.

Se o warehouse usado pelo conector for usado por outros fluxos de trabalho, você poderá dividir o custo por funções. Para dividir o uso por funções, utilize a consulta para dividir o uso do warehouse e adicione a seguinte cláusula WHERE na exibição QUERY_HISTORY:

WAREHOUSE_NAME = '<connector warehouse name>' AND
ROLE_NAME = '<role created for the connector to ingest data>'
Copy

Observe que a função é o nome criado durante a instalação do conector, por exemplo SNOWFLAKE_CONNECTOR_FOR_GOOGLE_ANALYTICS_RAW_DATA.

A consulta fornece apenas um custo aproximado.

Custo de armazenamento

O Snowflake Connector for Google Analytics Raw Data armazena dados em dois locais:

  • O banco de dados do conector, criado a partir do compartilhamento público, contém o estado interno do conector.

  • O esquema especificado pelo usuário no qual os dados ingeridos são armazenados.

O armazenamento de dados também é usado pelo recurso de Fail-safe do Snowflake. A quantidade de dados armazenados no Fail-safe depende das atualizações da tabela realizadas pelo conector.

Para verificar o uso do armazenamento utilizando o Snowsight, você pode usar um banco de dados separado para armazenar os dados ingeridos. Isso permite que você filtre os gráficos de uso de armazenamento por objeto, o que mostra o uso por banco de dados individual. Você também visualizar o uso de armazenamento consultando a exibição DATABASE_STORAGE_USAGE_HISTORY e filtrando os bancos de dados usados pelo conector.

Se o banco de dados contiver outros esquemas não relacionados ao conector, você poderá consultar o uso de armazenamento de um esquema específico dedicado aos dados ingeridos do conector. Você pode obter as informações da exibição TABLE_STORAGE_METRICS após filtrar por nomes de banco de dados e esquema e agregar colunas com uso de armazenamento.

Custo de transferência de dados

O Snowflake cobra apenas pelo tráfego de saída gerado pelo conector, com base no tamanho das solicitações do conector para Google Analytics Raw Data. As respostas do Google Analytics Raw Data não geram custo pelo lado do Snowflake.

As informações sobre o uso da transferência de dados estão disponíveis apenas na forma agregada para todas as funções externas no nível da conta. Para acessar o número de bytes transferidos, use a exibição DATA_TRANSFER_HISTORY e filtre pelo tipo de transferência EXTERNAL_ACCESS.

Pode haver taxas adicionais relacionadas à transferência de dados por parte doBigQuery: armazenamento de dados + tráfego de saída. Especificamente, o conector usa o que é conhecido como leituras de streaming (API de leitura de armazenamento).

Revise a documentação associada para obter detalhes.

Custo da tarefa de verificação de saúde

O conector cria uma tarefa interna e sem servidor que inspeciona regularmente a integridade da instância e envia um resumo ao Snowflake para fins de monitoramento. A tarefa é criada após a conclusão do assistente de instalação ou chamando CONFIGURE_CONNECTION em uma planilha. Ele gera um custo de computação fixo de até 0,5 crédito por dia, mesmo quando nenhuma propriedade está habilitada para ingestão.

A tarefa não pode ser explicitamente suspensa ou descartada, no entanto, pausar o conector também desabilitará a verificação de integridade.

Como determinar o tamanho ideal do warehouse para a instância do conector

Para encontrar o tamanho ideal do warehouse para o conector, você deve considerar os fatores que afetam o desempenho do conector, como:

  • Número de propriedades do Google Analytics

  • Quantidade de dados produzidos por cada uma das propriedades

  • Cronograma de sincronização de propriedades

Recomendamos que você defina um conjunto de expectativas mensuráveis, como intervalos de tempo em que todas as tabelas devem ser sincronizadas, e escolha o menor tamanho de warehouse que atenda a essas expectativas. Para determinar se você pode reduzir o tamanho do warehouse, consulte Monitoramento de carga do warehouse.

Para o Snowflake Connector for Google Analytics Raw Data, recomendamos começar a usar um warehouse XSMALL e, em seguida, experimentar um warehouse maior para possivelmente melhorar o desempenho.

Além disso, pode haver uma grande diferença no tamanho do warehouse necessário durante diferentes estágios de ingestão. Por exemplo, considere:

  • Um warehouse maior pode ser útil para a ingestão inicial em que o conector está carregando dados históricos, possivelmente anos de dados.

  • Ingestão diária normal, ao carregar apenas incrementos diários atuais de dados, os menores warehouses serão suficientes.

Além disso, se um grande conjunto de propriedades estiver habilitado para ingestão, considere um warehouse maior para que o conector possa acompanhar o fluxo de dados.