Um dicionário de dados é uma coleção organizada de metadados que descrevem os objetos ou entidades dentro de um sistema de informação, como um banco de dados ou um conjunto de dados.
Metadados são dados que descrevem outros dados. Eles fornecem informações sobre as características, conteúdo, qualidade, formato e outras propriedades dos dados.
O objetivo principal de um dicionário de dados é garantir a consistência, a integridade e a compreensão dos dados. Ele serve como uma fonte centralizada de informações sobre os dados, ajudando os usuários a entenderem o que os dados representam, como estão estruturados e como podem ser usados.
Qual ferramenta utilizar?
Comece simples. Você pode estruturar o dicionário de dados em um documento de texto (tabela), uma planilha ou, ainda, utilizar ferramentas específicas para isso.
Para didática deste artigo, vamos criar o nosso modelo de dicionário de dados em uma planilha. 😉
Quais as informações básicas necessárias?
Para atender a área de negócio, as informações básicas necessárias para estruturar um bom dicionário de dados são:
Nome da tabela (entidade)
Nome do campo (atributo)
Descrição do campo: resumo do dado que ele traz
Origem do dado: de qual sistema esse dado é extraído (ERP, CRM, etc.)
Regra de negócio: quando falamos de um atributo derivado (calculado, que não é um dado bruto dos bancos de dados), descrever a regra de negócio ou fórmula que calcula tal campo.
Estudo de caso - Análise de Recebimentos
Você foi contratado pela empresa XPTO para desenvolver um relatório analítico de receitas (entradas de caixa) da mesma, e o DBA já liberou seu acesso ao banco de dados.
O primeiro passo, é mapear as entidades (tabelas) relacionadas:
FIN_CONT_RECEBER: tabela que guarda as macro informações dos títulos a receber (entradas de caixa), gerados no financeiro.
FIN_MOV_CAIXA: tabela que armazena todas as ações realizadas em cada título no financeiro, seja entrada ou saída de caixa.
Download da planilha base para prática 🚀
Ao compreender o processo da empresa, você modela esses dados para criar a tabela derivada para ser consumida no BI, e entende que precisa criar uma única tabela contendo os dados dos títulos e uma coluna para cada ação daquele título.
Download do script SQL que gera a tabela fato_fin_entradas 🚀
Agora, com a tabela derivada estruturada, temos o seguinte dicionário de dados, onde:
Download do dicionário de dados completo 🚀
Entidade e atributo: trazem o nome da tabela e do campo a ser descrito.
Descrição: descrição explicativa dos dados trazidos em cada atributo.
DB origem: contempla a origem do banco de dados, o qual o dado bruto veio.
Entidade origem: o nome da tabela do DB origem.
Tipo: classifica o dado origem. Nativo, significa que veio exatamente como está armazenado no DB origem. Calculado, significa tratar-se de um atributo derivado.
Local cálculo (opcional): muitas vezes, podemos criar atributos derivados em N etapas do fluxo de dados (script SQL, PowerQuery, DAX, BigQuery, Looker, etc.). Esta informação auxilia nas manutenções das regras de negócio.
Regra de negócio: regra ou cálculo que originou o dado derivado.
Sua empresa precisa de governança de dados, mas não sabe por onde começar?
Comments