Diferença entre o esquema em estrela e floco de neve

Data warehousing é um sistema projetado para armazenar e organizar dados em repositórios centrais, incluindo dados de outras fontes. É um conceito central de business intelligence em modelos de banco de dados relacionais que emprega técnicas analíticas para integrar dados de negócios em um banco de dados central.

Existem dois modelos de arquitetura comuns usados ​​no armazenamento de dados:



  • Esquema Estelar
  • Esquema de Floco de Neve

Ambos são os modelos de banco de dados multidimensionais comuns usados ​​para atender às necessidades de grandes bancos de dados para fins analíticos em data warehouses reais.



Apresentamos uma comparação imparcial entre os dois para entender melhor qual é melhor do que o outro.

O que é Star Schema?

É o modelo de arquitetura mais comum e amplamente aceito usado para desenvolver data warehouses e data marts nos quais os dados são organizados em fatos e dimensões. É o modelo arquitetônico mais simples no qual uma tabela de fatos é usada para se referir a tabelas de múltiplas dimensões, imitando um padrão de estrela.



Como o nome sugere, o diagrama se assemelha a uma estrela com a tabela de fatos no centro e várias tabelas de dimensão irradiando dela, criando um padrão em forma de estrela.

Ele também é conhecido como Star Join Schema e armazena todos os atributos de uma dimensão em uma tabela de fatos desnormalizada para navegar rapidamente através de grandes conjuntos de dados multidimensionais que representam tempos de resposta de consulta rápidos.



O que é o esquema do floco de neve?

É uma extensão do esquema em estrela com funcionalidades adicionais. Ao contrário do esquema em estrela, as tabelas de dimensão no esquema em floco de neve são normalizadas em várias tabelas relacionadas.

O modelo arquitetônico representa um arranjo lógico de tabelas em uma hierarquia de relacionamento muitos-para-um, onde várias tabelas de dimensão são normalizadas em tabelas de subdimensão, parecendo um padrão de floco de neve, daí o nome.

É uma versão mais complexa do esquema em estrela com mais junções entre as tabelas de dimensão, o que representa um tempo de processamento lento para buscar dados, o que significa tempos de resposta de consulta lentos. Ele minimiza a redundância de dados que, por sua vez, melhora o desempenho da consulta.

Diferença entre Star e Snowflake Schema

Arquitetura do Esquema Estrela e Floco de Neve

Em bancos de dados relacionais, o esquema em estrela é o modelo arquitetônico mais simples usado para desenvolver data warehouses e data marts multidimensionais. Como o nome sugere, o modelo se assemelha a uma estrela com pontos irradiando do centro, o que significa que a tabela de fatos é o centro e os pontos são as tabelas de dimensão. Como outros modelos dimensionais, consiste em dados na forma de fatos e dimensões. O esquema do floco de neve, por outro lado, é o modelo arquitetônico mais complexo que se refere a um banco de dados multidimensional com disposição lógica de tabelas na forma de um floco de neve.

Tabela Dimensional

O esquema em floco de neve é ​​bastante semelhante ao esquema em estrela, exceto que pode ter mais de uma tabela de dimensão, que é posteriormente normalizada em várias tabelas relacionadas, chamadas de tabelas de subdimensões. Ele representa vários níveis de relacionamentos que se ramificam em um padrão de floco de neve. No entanto, o esquema em estrela armazena todos os atributos relacionados de uma dimensão em uma tabela de dimensão desnormalizada, o que torna mais fácil entender e lidar com consultas mais simples.

Modelo de Negócios do Esquema Star e Snowflake

Uma tabela de dimensão não pode conter linhas duplicadas em modelos de banco de dados relacionais pelo simples fato de que pode criar ambigüidades na recuperação. Cada tabela deve ter uma coluna ou combinação de colunas denominada chave primária que identifica exclusivamente todos os registros da tabela. Uma chave estrangeira é uma coluna ou grupo de colunas que fornece um link entre duas tabelas. No esquema em estrela, cada tabela de dimensão possui uma chave primária que está relacionada a uma chave estrangeira na tabela de fatos. A hierarquia de negócios em um esquema em floco de neve é ​​representada por um relacionamento de chave primária / chave estrangeira entre tabelas de dimensão.

Integridade de dados no esquema Star e Snowflake

A principal diferença entre os dois modelos de banco de dados relacional é a normalização. As tabelas de dimensão no esquema em estrela não são normalizadas, o que significa que o modelo de negócios usará relativamente mais espaço para armazenar tabelas de dimensão e mais espaço significa mais registros redundantes que, em última análise, causariam inconsistência. O esquema Snowflake, por outro lado, minimiza a redundância de dados porque as tabelas de dimensão são normalizadas, o que é responsável por registros redundantes muito menores. A hierarquia de negócios e suas dimensões são preservadas por meio da integridade referencial, o que significa que as relações podem ser atualizadas independentemente em data warehouses.

Desempenho de consulta

O esquema em estrela tem menos junções entre a tabela de dimensões e a tabela de fatos em comparação com o esquema em floco de neve, que tem várias junções, o que representa menos complexidade de consulta. Como as dimensões em um esquema em estrela são vinculadas por meio de uma tabela de fatos central, ele tem caminhos de junção claros, o que significa tempos de resposta de consulta rápidos e tempo de resposta rápido significa melhor desempenho. O esquema Snowflake tem um número maior de junções, portanto tempos de resposta de consulta mais longos, o que resulta em consultas mais complexas que, em última análise, comprometem o desempenho.

Esquema em estrela vs. esquema em floco de neve: gráfico de comparação


Resumo do Esquema do Floco de Neve dos versos Star

Ambos são os modelos de arquitetura mais comuns e amplamente adotados usados ​​para desenvolver warehouses de banco de dados e data marts. No entanto, todo modelo de negócios tem seu quinhão de prós e contras. Embora o esquema em estrela seja o modelo multidimensional mais simples usado para organizar dados em fatos e dimensões, ele é ideal para desenvolver data marts que envolvem relacionamentos menos complexos. O esquema do floco de neve é ​​uma representação lógica de tabelas em um banco de dados multidimensional no qual as dimensões são armazenadas em tabelas subdimensionais. A principal diferença entre os dois é a normalização. As tabelas de dimensão em um esquema em floco de neve são completamente normalizadas em várias tabelas de consulta, enquanto em um esquema em estrela, as tabelas de dimensão são desnormalizadas em uma tabela de fatos central.

Publicações Populares

Diferença entre MLA e APA

MLA vs. APA Existem estilos distintos de escrever artigos de pesquisa que são seguidos em todo o mundo. A maioria dos pesquisadores segue principalmente dois tipos de escrita

Diferença entre creme e manteiga

Creme Vs Manteiga Existem muitas variedades de creme de leite, assim como também existem muitos tipos de manteiga. Os muitos tipos de creme incluem o seguinte: duplo,

Diferença entre blogs e microblogs

Está a pensar na melhor forma de promover a sua empresa online e de ter uma presença online forte? Os blogs são a maneira mais fácil de fazer sua voz ser ouvida e transmitir sua mensagem

Diferença entre liberdade de expressão e apelo à ação

Por muito tempo, os seres humanos lutaram e continuam lutando por seus direitos e liberdades. No entanto, há uma linha tênue entre a distinção

Diferença entre gêmeos e clones

Gêmeos contra clones Gêmeos e clones costumam ser identificados erroneamente porque ambos parecem fisicamente iguais por fora. Os gêmeos idênticos, em

Diferença entre Leopard OS X e Leopard OS X Server

Leopard OS X vs Leopard OS X Server A Apple é bastante famosa por seus computadores desktop que estão executando o Leopard OS X, que é o sistema operacional mais recente para