

Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Do oltp ao DW
Tipologia: Notas de estudo
1 / 2
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Os Datawarehouses e Datamarts surgiram a partir da crescente necessidade de informações gerenciais que as organizações passaram a ter a medida em que aumentavam em tamanho, complexidade e necessidade de agilidade.
Os nomes DW e DM são empregados de acordo com o escopo ao qual são aplicados. O Datawarehouse ou DW é um banco de dados gerencial criado para atender as necessidades de informações gerenciais da empresa como um todo, enquanto que o Datamart ou DM é criado para atender as necessidades de informações gerenciais de setores ou camadas específicos das organizações, como por exemplo o setor financeiro de uma empresa.
Antes do surgimento destes tipos de bancos de dados as companhias não diferenciavam bem as informações operacionais existentes nos bancos de dados OLTP - On-line Transactional Processing, de outra estrutura de banco de dados como a dos bancos de dados Gerenciais.
Os OLTP's ou banco de dados transacionais eram criados a partir da análise do sistema de trabalho e operação da empresa, com o objetivo de permitir que tarefas anteriormente executadas manualmente de maneira repetitiva e artesanal, passassem a ser executadas automaticamente e de maneira mais precisa, garantindo melhores resultados em suas transações.
Porém, a medida em que a informática se tornou cada vez mais fácil e intuitiva do ponto de vista dos usuários, passou a ocorrer também uma crescente demanda por informações que existiam somente nos bancos de dados transacionais, como ERP's - grandes sistemas que integram operações intersetoriais desenvolvidos por empresas especializadas ou como os sistemas proprietários e legados desenvolvidos pelas próprias empresas para atender suas necessidades.
Quando tais demandas eram atendidas pela área de TI, normalmente o que ocorria era a geração de concorrência por recursos de processamento do sistema transacional, que era dividido entre os usuários operacionais e então com as consultas feitas por TI para atender às questões dos usuários gerenciais.
A situação descrita acima geralmente afetava drasticamente a capacidade de operação do sistema transacional, uma vez que tal sistema quase sempre era concebido somente previsto para atender a demanda operacional de usuários e não a demanda gerencial. Isto resultava, por exemplo, em tentativas desesperadas como: aumento de capacidade de processamento para atender as duas demandas no mesmo sistema - quase sempre muito caras e inviáveis pois simplesmente ampliava o escopo do problema; ou praticando a execução seletiva de analises gerenciais - restringindo as informações geradas para as camadas táticas e estratégicas da empresa asfixiando a inteligência desta.
Foi então que se chegou a seguinte conclusão: Já que existe a disputa por recursos de sistema por diferentes perfis de usuários - operacionais e gerenciais - que seja mantido o ambiente operacional para os usuários operacionais e que seja criado um novo ambiente de banco de dados que contenha somente as informações relevantes para as camadas tático- estratégicas da empresa.
Com isso passaram a ser criados bancos de dados cuja estrutura de tabelas e relacionamentos não precisava enfatizar o controle de entrada de dados que era feito nos bancos de dados transacionais a partir da normalização de tabelas, pois os bancos de dados gerenciais ao contrário dos OLTP's não seriam alimentados diretamente por pessoas, mas sim por processos de carga chamados de ETL - Extract Transform & Load ou - Extração Transformação e Carga, que seriam executados rotineiramente em horários que gerassem o mínimo de impacto no ambiente transacional.
Outra característica dos Bancos de Dados gerenciais como os Datawarehouses e Datamarts, é o fato de serem utilizados para que sejam feitas combinações de informações a fim de que sejam encontradas respostas para questões fundamentais de negócio e também para que seja possível encontrar tendências que indiquem oportunidades e ameaças para as organizações em conjunto com ferramentas de Mineração de Dados, muitas vezes isto pode ocorrer sem o mesmo grau de detalhamento que existe nos bancos de dados transacionais, levando o banco de dados gerencial a ser caracteristicamente mais agregado do que os OLTP's.
Também, por ser mais agregado, o banco de dados gerencial pode ser combinado em diferentes analises e por ser alimentado através de processos ETL e não por pessoas, o banco de dados gerencial não precisa ser normalizado, sendo que tabelas de entidade que
estão diretamente vinculadas independentemente de tabelas de relacionamento são integradas em uma única tabela chamada de tabela de Dimensão, da mesma forma os relacionamentos que visam atender um determinado aspecto do negócio, e que estão diretamente vinculadas independentemente de tabelas de entidade ou dimensão, são chamadas de tabelas de Fato.
Portanto as tabelas de dimensão contém informações de entidades que cujos atributos permitem que as informações sejam mais agregadas ou detalhadas, como por exemplo uma tabela de dimensão chamada local, podemos analisar os locais de maneira mais resumida como por continente ou país ou ainda analisar de maneira mais detalhada como por cidade e bairro. As tabelas de dimensão são utilizadas para atender questões fundamentais de negócio como: Quando? Onde? Como? O que? que são consideradas informações qualitativas da organização.
Já as tabelas de Fato contém as chaves primárias de cada dimensão que se relaciona com ela e também informações quantitativas como por exemplo: quantidade de funcionários treinados, quantidade produzida, índice de satisfação do cliente, margem de lucro, preço do produto e etc., respondendo a seguinte questão fundamental de negócio: Quanto?
Uma vez construídos os bancos de dados gerenciais estes só terão seu potencial realmente utilizado se integrados a soluções como: Business Intelligence, Business Planning e Business Scorecard. Caso contrário os usuários gerenciais ainda dependerão diretamente da área de Tecnologia da Informação para obterem suas informações necessárias para tomada de decisão. Pois os datawarehouses e o datamarts a pesar de possuírem uma estrutura mais simplificada do que a dos OLTP's, eles continuam sendo bancos de dados e se não houverem ferramentas de apoio CPM (vide acervo), os usuários teriam que programar extrações de dados como queries nos bancos de dados, o que acabaria sendo inviável para a maioria dos usuários gerenciais.
Avaliamos então, que os bancos de dados gerenciais recebem informações dos bancos OLTP's e as armazenam de acordo com o ponto de vista de negócios da empresa e de seus setores, mas normalmente este processo de extração, transformação e carga de dados - ETL, que ocorre para transferir os dados de um ambiente para outro, não ocorre de uma única vez. Na maioria das vezes são necessárias as construções de estruturas de apoio que podem servir somente como um repositório temporário de dados para estes sejam adequados às necessidades do DW/DM - são chamados de áreas de Stage, ou ainda estruturas mais especializadas que têm como objetivo armazenar no grau de detalhe necessário as informações operacionais antes que estão entrem nos bancos de dados gerenciais - são os chhamados - ODS ou Operational Datastores.
Assim como a maioria das soluções que encontramos no universo corporativo, a princípio os conceitos e terminologias como: DW, DM, BI ou CPM podem assustar um pouco. Mas no fundo são somente diferentes maneiras de organizar informações e processos de acordo com cada necessidade