3 Estágios de Normalização de Dados

Algumas das etapas importantes envolvidas no processo de normalização de dados são as seguintes:

Existem várias maneiras de agrupar elementos de dados em tabelas. O designer de banco de dados estaria interessado em selecionar a maneira que garante anomalias no agrupamento de dados. Essas anomalias incluem redundância de dados, perda de dados e relações espúrias nos dados.

Imagem Cortesia: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

A normalização visa eliminar as anomalias nos dados. O processo de normalização envolve três estágios, cada estágio gerando uma tabela na forma normal.

1. Primeira forma normal:

O primeiro passo na normalização é colocar todos os campos repetidos em arquivos separados e atribuir as chaves apropriadas a eles.

Tomando como exemplo o processamento da ordem de compra, os seguintes elementos de dados podem ser identificados em um pedido:

Identificação do Fornecedor

Nome do fornecedor

Endereço

Número do pedido

Encontro

Termos de pagamento

Termos de envio

S. não.

Código do produto

Descrição

Unidade de medida

Preço

Quantidade encomendada

Montante

Conforme detalhado acima, os 'termos de envio' são repetidos para cada nº de S. e haverá vários registros para ele em cada pedido de compra. No primeiro estágio de normalização, os elementos de dados repetidos são colocados em tabelas separadas. Assim, dividimos os elementos de dados em duas tabelas, conforme mostrado abaixo:

Os principais elementos de dados são mostrados em letras maiúsculas. A tabela está agora na primeira forma normal (INF) porque todos os elementos de dados repetidos (campos) estão em uma tabela separada (Tabela 1.2) e as chaves de recuperação foram atribuídas a cada tabela. Como existem dois elementos-chave em ambas as tabelas, pode-se dizer que cada tabela possui chaves compostas / compostas. Este processo de normalização simplificou os dados.

2. Segunda forma normal:

Neste estágio de normalização, todos os elementos não chave que são totalmente especificados por algo diferente da chave completa são colocados em uma tabela separada. Normalmente, esses elementos não principais dependem apenas de uma parte de uma chave composta.

Tomando em consideração a Tabela 1.1, uma chave composta que consiste em ID_Fornecedor_ e número de ordem de compra. está sendo usado. No entanto, os elementos não chave, como o nome e o endereço do fornecedor, dependem apenas do ID_do_fornecedor e não do nº da ordem de compra. Assim, esses elementos de dados não principais são colocados em tabelas separadas, juntamente com o elemento de dados chave - ID_de_fornecedor.

Da mesma forma, os elementos de dados não essenciais, como data, condições de pagamento e termos de envio, dependem apenas do pedido no. e, portanto, são colocados em uma tabela separada juntamente com o pedido de compra não. como elemento chave. Agora, temos três tabelas no lugar da Tabela 1.1:

Da mesma forma, podemos dividir a Tabela 1.2 separando elementos não-chave, como descrição, unidade de medida e preço, que dependem apenas de um código de produto em uma tabela. Da mesma forma, o código do produto, a quantidade e o valor dependem do número do pedido e do nº. S. são colocados em uma tabela separada.

A segunda forma normal (2NF) está pronta agora e há cinco tabelas.

3. Terceira forma normal:

Esse estágio de normalização permite eliminar elementos e tabelas de dados redundantes que são subconjuntos de outras tabelas. Os elementos redundantes são aqueles elementos de dados não chave que são colocados em mais de uma tabela dos elementos de dados virtuais.

Os elementos de dados virtuais são aqueles elementos cujo valor pode ser calculado usando outros elementos como e quando o valor é exigido. O valor do elemento de dados de valor na Tabela 1.2.2 pode ser calculado multiplicando-se a quantidade pelo preço, eliminando, assim, esses elementos de dados redundantes.

Se outra tabela chamada tabela mestre de fornecedores também estiver sendo mantida no banco de dados, é provável que a Tabela 1.1.2 seja um subconjunto da tabela principal do fornecedor. Assim, esta tabela também pode ser eliminada.

A terceira forma normal (3NF) oferece o agrupamento de dados simples, de fácil manutenção e com redundância mínima.

Assim, a normalização pode ajudar a reduzir a redundância, bem como eliminar outras anomalias nos dados. O processo de normalização de três etapas discutido acima é apenas sugestivo. Outras tentativas podem ser feitas ao projetar bancos de dados, se necessário com base na natureza dos dados.