top of page

Data Warehouse

O Data Warehouse funciona como um armazém de dados digitais tendo como objetivo, o de armazenar várias informações detalhadas relativamente a uma empresa, criando e organizando relatórios através de históricos para posteriormente serem usados pela empresa para ajudar a tomar decisões importantes utilizando como base os fatos apresentados.

Funciona basicamente como mostra a imagem.


Fonte de dados:

São os sistemas transacionais da empresa, podendo ser composto por diversas formas de dados.


Data Stage:

É composta por uma área de armazenagem e um conjunto de processos. Tendo como função, extrair os dados dos sistemas transacionais, realizar a limpeza, a transformação, a combinação, e a duplicação e preparação dos dados para o uso no Data Warehouse.


Servidor de apresentação:

É o ambiente onde os dados são organizados e armazenados para consulta direta pelos usuários finais. Normalmente os dados estão disponíveis nestes servidores em bancos de dados relacionais, mas também podem estar armazenados em tecnologia OLAP (OnLine Analytical Processing ) já que muitos data marts trabalham apenas com dados no modelo dimensional.


Data Mart:

Subconjunto lógico do DW, geralmente divididos por departamento ou visões necessárias para os usuários.


Data Mining:

Também conhecido como mineração de dados, o Data Mining trabalha em grandes massas de dados onde existem muitas correlações entre os dados que não são perceptíveis facilmente. Os Data Warehouses são constituídos, normalmente, de imensa quantidade de dados, há necessidade de uma ferramenta para varrer automaticamente o DW a fim de pesquisar tendências e padrões através de regras pré-definidas que dificilmente seriam encontrados em uma pesquisa comum.


Ferramentas de acesso aos dados:

É A maneira como os dados são extraídos e integrados com cada processo distinto do DW.

As funções para a transformação dos dados são:

Extração: retirada dos dados dos sistemas transacionais e armazenagem na área de data stage.

Carga de dimensões processadas: realimentação do processo para garantir a representação correta dos dados em novo formato.

Carga, Replicação e Recuperação: quando pronto, o dado é carregado no data mart correspondente e são criados (ou atualizados) índices para melhorar a performance das consulta.

Alimentação: apresenta as visões do data mart de acordo com as necessidades dos usuários.

Carga dos resultados dos modelos: serve para realimentar possíveis modificações no data mart, caso este não esteja adequado a aplicação que o utiliza.


bottom of page