Em um mundo cada vez mais orientado por dados, habilitar pessoas a acessarem e utilizarem informações com autonomia não é um diferencial – é uma questão de sobrevivência. Na Robbin, acreditamos que o dado precisa ser tratado como um produto acessível e utilizável por todos. Mas como fazer isso em um cenário onde os dados estão espalhados, brutos e difíceis de entender?
Neste artigo, vou compartilhar como estruturamos a democratização de dados na Robbin, os desafios que enfrentamos e os passos que estamos dando para tornar o acesso a dados algo realmente cotidiano.
O ponto de partida: Metabase, Snowflake e… dependência
Hoje, nossas principais ferramentas de dados são o Metabase, onde todos os times acessam dashboards e relatórios de forma visual, e o Snowflake, usado pelo time de dados para análises e extração em larga escala.
Essa estrutura é funcional, mas não ideal. O motivo? Uma grande dependência do time de dados para criação de dashboards e visualizações. As bases estão em seu estado bruto (raw), com muitas redundâncias e poucos tratamentos prévios. Além disso, não tínhamos um catálogo de dados que ajudasse as pessoas a entenderem o que cada tabela representa, dificultando o uso por quem não está no dia a dia do time de dados.
A virada: 3 frentes para facilitar o uso dos dados
Para realmente democratizar o acesso aos dados, atacamos o problema em três frentes estratégicas:
1. Separação dos dados em camadas (Arquitetura Medallion)
Implementamos uma arquitetura em camadas inspirada no modelo Medallion, que organiza os dados em três níveis:
- Raw (Bronze): ingestão dos dados diretamente dos sistemas de origem para o AWS S3, sem qualquer tratamento.
- Trusted (Silver): aplicação das regras de negócio para construir uma versão consistente dos dados. Aqui seguimos a metodologia de Single Source of Truth (SSoT), garantindo uniformidade de conceitos como “cliente”, “transação”, “pagamento”.
- Delivery (Gold): dados organizados por frente de negócio, já preparados para consumo direto via Metabase. Essa é a camada de Multi Version of Truth (MVoT), adaptada às diferentes necessidades dos times.
A importância de equilibrar uma fonte única e confiável (SSoT) com versões flexíveis e específicas (MVoT) reflete um dos principais pilares da estratégia de dados numa organização. Segundo o artigo da Harvard Business Review “What’s Your Data Strategy?”, “equilibrar a ofensiva e a defensiva” em sua estratégia de dados é essencial para alinhar controle e flexibilidade, tanto para minimizar riscos quanto para impulsionar objetivos de negócio.
2. Criação do grupo de embaixadores de dados
Para quebrar a dependência do time central de dados, criamos o programa de embaixadores de dados:
- São analistas dentro de cada time de negócio.
- Passaram por treinamentos em Metabase e SQL.
- Têm autonomia para criar seus próprios dashboards e reports.
- São os principais responsáveis por construir e manter a camada de Delivery, já que conhecem profundamente as necessidades de seus times.
Essa iniciativa tem sido essencial para ampliar o uso dos dados de forma sustentável e descentralizada.
3. Catálogo e dicionário de dados
Outra barreira importante era a falta de documentação clara das tabelas, colunas e relacionamentos. Passamos a construir um catálogo de dados, com:
- Metadados e descrições das colunas das camadas Trusted e Delivery.
- Mapeamento de relacionamentos entre tabelas.
- Métricas de qualidade dos dados, que ajudam a monitorar e melhorar a confiança nas informações.
Esse material é constantemente atualizado e serve como ponte entre dados e entendimento de negócio.
O impacto: mais autonomia, menos gargalos
Com essas três frentes, conseguimos transformar o cenário de uso de dados na Robbin. Hoje:
- Todos os times têm acesso aos dados via Metabase.
- A criação de dashboards e relatórios não depende exclusivamente do time de dados.
- As tabelas estão mais limpas, organizadas e documentadas.
- A cultura de dados se fortalece a cada novo embaixador ou dashboard criado.
Ainda há muito a fazer, mas o caminho está bem traçado.
Próximos passos: IA e evolução contínua
O trabalho de democratização é contínuo. Nossos próximos passos incluem:
- Aprimorar as três frentes com ainda mais automatização, padronização e qualidade.
- Incorporar um agente de IA que possa acessar os dados e responder perguntas simples de negócio, como “quantos cartões emitimos nesta semana?”, sem necessidade de escrever SQL ou acessar dashboards.
Acreditamos que o futuro passa pela autonomia radical com responsabilidade. E queremos continuar sendo protagonistas dessa transformação.