Diferença entre o esquema em estrela e floco de neve

Data warehousing é um sistema projetado para armazenar e organizar dados em repositórios centrais, incluindo dados de outras fontes. É um conceito central de business intelligence em modelos de banco de dados relacionais que emprega técnicas analíticas para integrar dados de negócios em um banco de dados central.

Existem dois modelos de arquitetura comuns usados ​​no armazenamento de dados:



  • Esquema Estelar
  • Esquema de Floco de Neve

Ambos são os modelos de banco de dados multidimensionais comuns usados ​​para atender às necessidades de grandes bancos de dados para fins analíticos em data warehouses reais.



Apresentamos uma comparação imparcial entre os dois para entender melhor qual é melhor do que o outro.

O que é Star Schema?

É o modelo de arquitetura mais comum e amplamente aceito usado para desenvolver data warehouses e data marts nos quais os dados são organizados em fatos e dimensões. É o modelo arquitetônico mais simples no qual uma tabela de fatos é usada para se referir a tabelas de múltiplas dimensões, imitando um padrão de estrela.



Como o nome sugere, o diagrama se assemelha a uma estrela com a tabela de fatos no centro e várias tabelas de dimensão irradiando dela, criando um padrão em forma de estrela.

Ele também é conhecido como Star Join Schema e armazena todos os atributos de uma dimensão em uma tabela de fatos desnormalizada para navegar rapidamente através de grandes conjuntos de dados multidimensionais que representam tempos de resposta de consulta rápidos.



O que é o esquema do floco de neve?

É uma extensão do esquema em estrela com funcionalidades adicionais. Ao contrário do esquema em estrela, as tabelas de dimensão no esquema em floco de neve são normalizadas em várias tabelas relacionadas.

O modelo arquitetônico representa um arranjo lógico de tabelas em uma hierarquia de relacionamento muitos-para-um, onde várias tabelas de dimensão são normalizadas em tabelas de subdimensão, parecendo um padrão de floco de neve, daí o nome.

É uma versão mais complexa do esquema em estrela com mais junções entre as tabelas de dimensão, o que representa um tempo de processamento lento para buscar dados, o que significa tempos de resposta de consulta lentos. Ele minimiza a redundância de dados que, por sua vez, melhora o desempenho da consulta.

Diferença entre Star e Snowflake Schema

Arquitetura do Esquema Estrela e Floco de Neve

Em bancos de dados relacionais, o esquema em estrela é o modelo arquitetônico mais simples usado para desenvolver data warehouses e data marts multidimensionais. Como o nome sugere, o modelo se assemelha a uma estrela com pontos irradiando do centro, o que significa que a tabela de fatos é o centro e os pontos são as tabelas de dimensão. Como outros modelos dimensionais, consiste em dados na forma de fatos e dimensões. O esquema do floco de neve, por outro lado, é o modelo arquitetônico mais complexo que se refere a um banco de dados multidimensional com disposição lógica de tabelas na forma de um floco de neve.

Tabela Dimensional

O esquema em floco de neve é ​​bastante semelhante ao esquema em estrela, exceto que pode ter mais de uma tabela de dimensão, que é posteriormente normalizada em várias tabelas relacionadas, chamadas de tabelas de subdimensões. Ele representa vários níveis de relacionamentos que se ramificam em um padrão de floco de neve. No entanto, o esquema em estrela armazena todos os atributos relacionados de uma dimensão em uma tabela de dimensão desnormalizada, o que torna mais fácil entender e lidar com consultas mais simples.

Modelo de Negócios do Esquema Star e Snowflake

Uma tabela de dimensão não pode conter linhas duplicadas em modelos de banco de dados relacionais pelo simples fato de que pode criar ambigüidades na recuperação. Cada tabela deve ter uma coluna ou combinação de colunas denominada chave primária que identifica exclusivamente todos os registros da tabela. Uma chave estrangeira é uma coluna ou grupo de colunas que fornece um link entre duas tabelas. No esquema em estrela, cada tabela de dimensão possui uma chave primária que está relacionada a uma chave estrangeira na tabela de fatos. A hierarquia de negócios em um esquema em floco de neve é ​​representada por um relacionamento de chave primária / chave estrangeira entre tabelas de dimensão.

Integridade de dados no esquema Star e Snowflake

A principal diferença entre os dois modelos de banco de dados relacional é a normalização. As tabelas de dimensão no esquema em estrela não são normalizadas, o que significa que o modelo de negócios usará relativamente mais espaço para armazenar tabelas de dimensão e mais espaço significa mais registros redundantes que, em última análise, causariam inconsistência. O esquema Snowflake, por outro lado, minimiza a redundância de dados porque as tabelas de dimensão são normalizadas, o que é responsável por registros redundantes muito menores. A hierarquia de negócios e suas dimensões são preservadas por meio da integridade referencial, o que significa que as relações podem ser atualizadas independentemente em data warehouses.

Desempenho de consulta

O esquema em estrela tem menos junções entre a tabela de dimensões e a tabela de fatos em comparação com o esquema em floco de neve, que tem várias junções, o que representa menos complexidade de consulta. Como as dimensões em um esquema em estrela são vinculadas por meio de uma tabela de fatos central, ele tem caminhos de junção claros, o que significa tempos de resposta de consulta rápidos e tempo de resposta rápido significa melhor desempenho. O esquema Snowflake tem um número maior de junções, portanto tempos de resposta de consulta mais longos, o que resulta em consultas mais complexas que, em última análise, comprometem o desempenho.

Esquema em estrela vs. esquema em floco de neve: gráfico de comparação


Resumo do Esquema do Floco de Neve dos versos Star

Ambos são os modelos de arquitetura mais comuns e amplamente adotados usados ​​para desenvolver warehouses de banco de dados e data marts. No entanto, todo modelo de negócios tem seu quinhão de prós e contras. Embora o esquema em estrela seja o modelo multidimensional mais simples usado para organizar dados em fatos e dimensões, ele é ideal para desenvolver data marts que envolvem relacionamentos menos complexos. O esquema do floco de neve é ​​uma representação lógica de tabelas em um banco de dados multidimensional no qual as dimensões são armazenadas em tabelas subdimensionais. A principal diferença entre os dois é a normalização. As tabelas de dimensão em um esquema em floco de neve são completamente normalizadas em várias tabelas de consulta, enquanto em um esquema em estrela, as tabelas de dimensão são desnormalizadas em uma tabela de fatos central.

Publicações Populares

Nota do médico para bebida? Winston Churchill prescreveu quantidades 'indefinidas' de álcool durante a proibição

Proibição - o que começou como uma tentativa sincera de conter a violência doméstica e defender os valores tradicionais do lar desceu rapidamente para o

Vung Tau - o destino de R&R mais quente do Vietnã

Tanto para os soldados americanos quanto para os vietcongues, as belas e pacíficas praias de Vung Tau ofereciam uma pausa relaxante da brutalidade da guerra que grassava a poucos quilômetros de distância.

Diferença entre métodos FIFO e LIFO de avaliação de estoque

Sendo um dos maiores ativos em negócios de varejo e manufatura, o estoque, incluindo matérias-primas, produtos em produção e produtos acabados, é um dos

Diferença entre bonito e lindo

A confusão entre belo e lindo sempre foi abundante. Como tal, na maioria das vezes alguém complementaria uma dama e diria que ela é bonita hoje

Diferença entre os Superstars 1 e 2 da Adidas

O que celebridades famosas como Fergie, Chris Martin, NBA, Jay-Z e Craig David têm em comum? A resposta é: um par de Superstars da Adidas. Inegavelmente, este

Diferença entre etanol e biodiesel

Etanol vs. Biodiesel Com o rápido aumento da emissão de poluentes na atmosfera, provavelmente por causa das emissões de carbono da gasolina movida a gasolina