Definição
Dado o volume crescente de dados que empresas acumulam e a multiplicidade de sistemas que os geram e consomem, um problema se torna inevitável sem estrutura deliberada: ninguém sabe exatamente o que cada dado significa, de onde veio, quem pode acessá-lo, se é confiável, e por quanto tempo deve ser retido. Diferentes áreas calculam a mesma métrica de formas diferentes e chegam a números diferentes. Dados pessoais de clientes são armazenados sem controle de acesso adequado. A "tabela de clientes" existe em cinco versões diferentes com critérios de atualização inconsistentes.
Data Governance é o conjunto de políticas, processos, papéis e padrões que define como os dados de uma organização são gerenciados, protegidos, acessados e usados ao longo de seu ciclo de vida. É a resposta organizacional ao caos que emerge quando dados proliferam sem responsabilidade clara.
Governança de dados não é primariamente uma solução tecnológica — é uma solução de processo e organização. A tecnologia (catálogos de dados, ferramentas de linhagem, sistemas de controle de acesso) suporta a governança, mas não a substitui. Organizações que compram ferramentas de governança sem mudar processo e accountability chegam ao mesmo lugar: dados inconsistentes que ninguém confia.
Os problemas que governança resolve
Inconsistência de definições: o financeiro calcula receita de um jeito, o comercial de outro, o produto de outro. Reuniões de gestão viram discussões sobre qual número está certo em vez de discussões sobre o que fazer. Governança estabelece definições canônicas — a "versão oficial" de cada métrica.
Dados não confiáveis: pipelines de ETL que quebram silenciosamente, dados duplicados sem tratamento, campos nulos onde não deveriam ser. Sem monitoramento de qualidade e responsabilidade clara pela correção, esses problemas se acumulam até que a confiança nos dados é zero.
Acesso não controlado: dados pessoais de clientes acessíveis por qualquer analista, senhas de sistemas em planilhas compartilhadas, dados sensíveis sem classificação. Além do risco de LGPD, é risco operacional real.
Descoberta impossível: o analista passa horas tentando encontrar a tabela certa antes de conseguir fazer a análise. Ninguém sabe o que existe, o que está atualizado, qual é a fonte de verdade.
Linhagem desconhecida: quando um número no dashboard está errado, ninguém sabe de onde veio nem como foi calculado. Debugging de dados vira investigação arqueológica.
Os componentes de um framework de governança
1. Papéis e responsabilidades:
- Chief Data Officer (CDO) ou equivalente: responsável pela estratégia de dados e pela governança no nível executivo.
- Data Owner: responsável de negócio por um domínio de dados (dados de clientes, dados financeiros, dados de produto). Define as regras de negócio e tem poder de decisão sobre uso e acesso.
- Data Steward: responsável operacional pela qualidade dos dados de um domínio. Implementa e monitora as políticas definidas pelo Data Owner.
- Data Consumer: quem usa os dados — analistas, cientistas de dados, times de negócio.
2. Catálogo de dados: inventário dos assets de dados da organização — quais tabelas existem, o que cada campo significa, quem é o owner, quando foi atualizado, qual é a qualidade esperada. Ferramentas: DataHub (open source), Alation, Collibra, Atlan. Um catálogo sem processo de manutenção vira catálogo desatualizado rapidamente — a governança define quem atualiza e quando.
3. Classificação de dados: categorizar dados por sensibilidade (público, interno, confidencial, altamente confidencial, dados pessoais, dados sensíveis conforme LGPD). A classificação define as regras de acesso e retenção aplicáveis.
4. Controle de acesso: quem pode ler, modificar ou excluir quais dados. Baseado em papéis (RBAC) ou em atributos (ABAC). Em ambientes cloud, IAM policies por bucket, tabela e coluna. Mascaramento de dados sensíveis para usuários sem permissão.
5. Data quality: definição de regras de qualidade por domínio (campo X nunca nulo, valor Y dentro do range Z, contagem de registros não cai abaixo de W), monitoramento automático, alertas em violação, processo de correção com responsável identificado.
6. Linhagem de dados (data lineage): rastrear de onde cada dado veio e como foi transformado — do sistema de origem até o dashboard. Permite debugging eficiente e auditoria. Ferramentas como dbt geram linhagem automaticamente para transformações SQL.
7. Políticas de retenção: quanto tempo cada tipo de dado é retido antes de ser deletado ou arquivado. Determinado por requisitos legais (LGPD, regulações setoriais), necessidade de negócio e custo de armazenamento.
Data Governance e LGPD
A LGPD (Lei Geral de Proteção de Dados) tornou governança de dados uma necessidade legal, não apenas prática de gestão. Organizações que processam dados pessoais de titulares brasileiros têm obrigações específicas que dependem de governança funcional.
Inventário de dados pessoais: saber quais dados pessoais a organização processa, com qual finalidade, em qual base legal, em quais sistemas. Governança começa com esse mapeamento.
Direitos do titular: o direito de acesso, correção, exclusão e portabilidade exige que a organização consiga localizar os dados de um titular específico em todos os sistemas e agir sobre eles. Sem governança (sem saber onde os dados estão), esses direitos são impossíveis de exercer.
Consentimento e finalidade: dados coletados para uma finalidade não podem ser usados para outra sem nova base legal. Governança garante que o uso de dados respeita a finalidade registrada.
Minimização: coletar apenas o que é necessário. Governança de dados deve incluir revisão periódica de quais dados são coletados e por quê — e eliminação do que não é mais necessário.
Data Mesh e governança federada
O modelo tradicional de governança é centralizado: uma equipe central define e monitora tudo. Isso não escala quando a organização cresce e os domínios de dados proliferam.
Data Mesh propõe governança federada: cada domínio de negócio é responsável pela qualidade e acessibilidade de seus dados (como produtos), com standards comuns estabelecidos centralmente (interoperabilidade, segurança, qualidade mínima). A plataforma de dados centralmente provida suporta os domínios sem controlar o conteúdo.
Essa abordagem distribui responsabilidade para quem tem mais contexto sobre cada domínio — mas exige maturidade organizacional para funcionar. Para organizações menores, governança centralizada é mais prática.
Perspectiva Auspert
Governança de dados é frequentemente adiada com o argumento de que é overhead burocrático — e adotada em modo de urgência quando um problema de qualidade de dados corrompe análises críticas, quando a ANPD notifica sobre violação de LGPD, ou quando um projeto de dados estratégico falha por dados inconsistentes.
O investimento mínimo viável em governança para PMEs não exige plataforma de catálogo sofisticada nem equipe dedicada. Requer: definir quem é o owner de cada domínio de dados principal (financeiro, clientes, produtos), documentar as definições das métricas mais usadas em um local acessível, estabelecer regras básicas de controle de acesso a dados sensíveis, e criar um processo simples de reporte e correção de problemas de qualidade. Esse nível de estrutura já resolve 80% dos problemas de dados que afetam PMEs.
A ferramenta mais usada de governança de dados em PMEs é uma planilha bem mantida com as definições de métricas. Não é ideal — mas é infinitamente melhor do que definições implícitas na cabeça de cada pessoa.
Veja também
Planejamento Estratégico
Planejamento estratégico é o processo que transforma intenção em direção. Entenda sua estrutura, como aplicar em PMEs e o que diferencia um plano real de um exercício formal.
EstratégiaBalanced Scorecard
O Balanced Scorecard amplia a visão da gestão para além dos indicadores financeiros. Entenda as quatro perspectivas, o papel do mapa estratégico e como implementar com profundidade em PMEs.
EstratégiaValue Proposition
Proposta de valor é a resposta para a pergunta que o cliente faz antes de comprar. Entenda a estrutura, os erros mais comuns e como construir uma proposta específica, crível e durável.