Sistemas Informação

sexta-feira, 18 de junho de 2010

Data Warehouse - ARQUITETURA GLOBAL

quinta-feira, 17 de junho de 2010

Data Warehouse - EXEMPLOS DE SGBD QUE PERMITEM SUA IMPLEMENTAÇÃO

Data Warehouse - EXEMPLOS DE UTILIZAÇÃO

quarta-feira, 2 de dezembro de 2009

Álgebra Relacional - Exercícios

terça-feira, 1 de dezembro de 2009

1) O que significa a sigla SQL? Qual a finalidade dessa linguagem? Como ela se divide? Quais são os comandos principais de cada divisão? Explique-os resumidamente.

Structured Query Language, ou Linguagem de Consulta Estruturada ou SQL, é uma linguagem de pesquisa declarativa para banco de dados relacional.Surgiu para padronizar a manipulação dos dados do BD. É dividida em:

DML - Linguagem de Manipulação de Dados
Primeiro há os elementos da DML (Data Manipulation Language - Linguagem de Manipulação de Dados). A DML é um subconjunto da linguagem usada para inserir, atualizar e apagar dados.
INSERT, UPDATE, DELETE

DDL - Linguagem de Definição de Dados
O segundo grupo é a DDL (Data Definition Language - Linguagem de Definição de Dados). Uma DDL permite ao utilizador definir tabelas novas e elementos associados. A maioria dos bancos de dados de SQL comerciais tem extensões proprietárias no DDL.
CREATE, DROP

DCL - Linguagem de Controle de Dados
O terceiro grupo é o DCL (Data Control Language - Linguagem de Controle de Dados). DCL controla os aspectos de autorização de dados e licenças de usuários para controlar quem tem acesso para ver ou manipular dados dentro do banco de dados.
GRANT, REVOKE

DTL - Linguagem de Transação de Dados
BEGIN WORK, COMMIT, ROLLBACK

DQL - Linguagem de Consulta de Dados
Embora tenha apenas um comando, a DQL é a parte da SQL mais utilizada. O comando SELECT permite ao usuário especificar uma consulta ("query") como uma descrição do resultado desejado. Esse comando é composto de várias cláusulas e opções, possibilitando elaborar consultas das mais simples às mais elaboradas.
FROM, WHERE, GROUP BY, HAVING, ORDER BY, DISTINCT.

2) Quais são os tipos de dados que a linguagem SQL padrão (ANSI) suporta? Explique cada um resumidamente.

Os dados podem ser armazenados em diferentes tipos, o tipo define as operações que poder ser executadas com determinado dado. Os tipos no SQL são:

Inteiros: integer, int, smallint e tinyint;
Reais: float, double, real, numeric;
Caracteres: char;
Texto: varchar, text;
Data: date

3) Explique o comando SELECT. Sua sintaxe, características básicas, Cláusula Where, operadores, conectores, subconsultas, funções de agregação, cláusula order by, group by, having e compute by.

O comando SELECT Instrui o programa principal do banco de dados para retornar a informação como um conjunto de registros.
Para executar esta operação, o programa principal de banco de dados procura a tabela ou tabelas especificadas, extrai as colunas escolhidas, seleciona as linhas que satisfazem o critério e classifica ou agrupa as linhas resultantes na ordem especificada.

Sintaxe

SELECT [predicado { * tabela.* [tabela.]campo1 [AS alias1] [, [tabela.]campo2 [AS alias2] [, ...]]}
FROM expressãotabela [, ...] [IN bancodedadosexterno]
[WHERE... ]
[GROUP BY... ]
[HAVING... ]
[ORDER BY... ]
[WITH OWNERACCESS OPTION]

WHERE – Utilizada para especificar as condições que devem reunir os registros que serão selecionados.

GROUP BY – Utilizada para separar os registros selecionados em grupos específicos.

HAVING – Utilizada para expressar a condição que deve satisfazer cada grupo.

ORDER BY – Utilizada para ordenar os registros selecionados com uma ordem especifica.

Funções de Agregação
As funções de soma se usam dentro de uma cláusula SELECT em grupos de registros para devolver um único valor que se aplica a um grupo de registros.

AVG – Utilizada para calcular a media dos valores de um campo determinado.

COUNT – Utilizada para devolver o número de registros da seleção.

SUM – Utilizada para devolver a soma de todos os valores de um campo determinado.

MAX – Utilizada para devolver o valor mais alto de um campo especificado.

MIN – Utilizada para devolver o valor mais baixo de um campo especificado.

Operadores Lógicos
AND – E lógico. Avalia as condições e devolve um valor verdadeiro caso ambos sejam corretos.
OR – OU lógico. Avalia as condições e devolve um valor verdadeiro se algum for correto.
NOT – Negação lógica. Devolve o valor contrário da expressão.

Operadores Relacionais

< – Menor que
> – Maior que
<> – Diferente de
<= – Menor ou Igual que
>= – Maior ou Igual que
= – Igual a

BETWEEN – Utilizado para especificar um intervalo de valores.

LIKE – Utilizado na comparação de um modelo e para especificar registros de um banco de
dados."Like" + extensão % vai significar buscar todos resultados com o mesmo início da extensão.

4) O que é uma visão (view) em SQL? Explique suas propriedades, utilidades e os comandos para a sua manipulação.

Uma view é uma maneira alternativa de observação de dados de uma ou mais entidades (tabelas), que compõem uma base de dados. Pode ser considerada como uma tabela virtual ou uma consulta armazenada. Geralmente e recomendável, uma view, implementada encapsulando uma instrução SELECT (busca de dados para exposição), guarda os dados em uma tabela virtual, armazenando também em cache, pois todas as consultas ao banco, encapsuladas ou não, ao serem executadas, são armazenadas em cache. Por este motivo, pode ser mais rápido ter uma consulta armazenada em forma de view, em vez de ter que retrabalhar uma instrução.
O comando para criar uma view é o CREATE VIEW.

5) O que são procedimentos armazenados (stored procedure)? Para que servem, o que eles permite fazer e quais comandos podemos utilizar no seu corpo e para criá-los?

Stored Procedure é um conjunto de comandos, ao qual é atribuído um nome. Este conjunto fica armazenado no Banco de Dados e pode ser chamado a qualquer momento tanto pelo SGBD (sistema Gerenciador de Banco de Dados) quanto por um sistema que faz interface com o mesmo. A utilização de Stored Procedures é uma técnica eficiente de executarmos operações repetitivas. Ao invés de digitar os comandos cada vez que determinada operação necessite ser executada

CREATE PROCEDURE nome_do_stored_procedure[ {@parametro tipo_de_dados_parametro}[=valor_default] [output] ][,...n]AS comando1, comando2, comando3, ..., comando2GO.

6) O que são gatilhos (TRIGGERS)? Para que servem, quais as vantagens na sua utilização, como funcionam e como criá-los?

Um Trigger é bloco de comandos Transact-SQL que é automaticamente executado quando um comando INSERT , DELETE ou UPDATE for executado em uma tabela do banco de dados.
Os Triggers são usados para realizar tarefas relacionadas com validações , restrições de acesso , rotinas de segurança e consistência de dados ; desta forma estes controles deixam de ser executados pela aplicação e passam a ser executados pelos Triggers em determinadas situações :
Mecanismos de validação envolvendo múltiplas tabelas
Criação de contéudo de uma coluna derivada de outras colunas da tabela
Realizar análise e e atualizações em outras tabelas com base em alterações e/ou incluções da tabela atual
A criação de um Trigger envolve duas etapas :
Um comando SQL que vai disparar o Trigger ( INSERT , DELETE , UPDATE)
A ação que o Trigger vai executar ( Geralmente um bloco de códigos SQL )
Podemos criar um Trigger usando o comando Create Trigger

Normalização

1) Quais são as diretrizes informais para o projeto de esquema de relações? Explique resumidamente cada uma.

Diretriz 1ª - Projetar um esquema de relação de maneira que seja simples descrever seu significado. Normalmente, isso significa que não se pode combinar atributos de múltiplos tipos de entidades e tipos de relacionamentos numa simples relação. Intuitivamente, se um esquema de relação corresponde a um tipo de entidade ou tipo de relacionamento, o significado tende a ser claro. Por outro lado, tende ser uma mistura de múltiplas entidades e relacionamentos e, assim, semanticamente não-clara.

Diretriz 2ª - Projetar esquemas de relações de maneira que nenhuma anomalia de alteração ocorra em relações. Se existir alguma anomalia, isso deverá ser considerado para que as modificações pelos programas ocorram corretamente.

Diretriz 3ª - Tanto quanto possível, evite colocar atributos em um esquema de relação base
cujos valores possam ser null. Se for inevitável os valores nulls, esteja seguro que eles se apliquem apenas em casos excepcionais e não se apliquem na maioria das tuplas da relação.

Diretriz 4ª - Projetar esquemas de relações tal que, quando aplicadas operações JOINNATURAIS, os atributos nas condições-joins envolvam atributos que sejam ou chavesprimárias ou chaves-estrangeiras de maneira a garantir que nenhuma tupla espúria seja gerada.

2) Quais são as métricas de qualidade informal para projeto de esquemas de relações? Explique resumidamente cada uma delas.

- Semântica de atributos – verifica se o atributo caracteriza (pertence) mesmo aquela entidade;

- Redução de valores redundantes em tuplas – verifica se o atributos geram redundância e portanto desperdício de espaço;

- Redução de valores nulos em tuplas – uma relação degenerada (“Tabelão”) pode causar valores null, o que prejudica a interpretação dos dados;

- Não permissão de tuplas espúrias – tabelas degeneradas, quando relacionadas podem gerar informações/dados errôneos (tuplas espúrias).

3) O que é e para que serve o conceito de dependência funcional? Quais são os tipos de dependência? Explique-os

Uma dependência funcional é uma restrição entre dois conjuntos de atributos de uma base de dados.
Dados os atributos “A” e “B” de uma entidade, diz-se que “B” é funcionalmente dependente de “A” se e somente se, a cada valor de “A” está associado um único
valor de “B”.

Dependência Funcional Composta
Dado um atributo ou um conjunto de atributos “B” de uma entidade, sendo a chave composta por um conjunto de atributos “A”, diz-se que “B” é completamente dependente
funcional da chave primária, se e somente se, a cada valor da chave (e não a parte dele), está associado um valor para cada atributo do conjunto “B”.

Dependência Funcional Transitiva
Dados os atributos “A”, “B” e “C” de uma entidade, sendo “A” a chave, diz-se que “B” e “C” são dependentes transitivos se e somente se, forem funcionalmente dependente de “A”
além de existir uma dependência funcional entre eles.

4) O que é e para que serve normalização de dados relacionais? Quando será utilizada a normalização na maioria das vezes?

Normalização é o processo pelo qual transformamos um Banco de Dados fora do padrão do M-Rel, num BD normalizado (dentro do padrão M-Rel). Normalmente é usado em Banco de Dados antigos ou criados por pessoas não técnicas.

5) O que são e quantas são as formas formais de relação? Explique-as resumidamente. Para manter eficiência e a simplicidade de processamento em certos casos podemos normalizar as relações até a 3ºFN por que?

Primeira Forma Normal (1FN)
Uma relação está na 1ª forma normal (1FN) quando:
- os domínios de todos os atributos consistem apenas em valores atômicos;
- não existem subgrupos de atributos repetidos.
Passagem de uma entidade à 1FN:
- Eliminar subgrupos repetidos, decompondo a relação em duas (ou mais) relações.

Segunda Forma Normal (2FN)
Uma relação está na 2ª forma normal (2FN) quando:
- estiver na 1FN;
- todos os atributos que não pertencem à chave dependem de toda a chave (e não de um subconjunto da chave).
Passagem de uma relação à 2FN:
- Separa os atributos que dependem de um subconjunto da chave, decompondo a relação em duas (ou mais) relações.

Terceira Forma Normal (3FN)
Uma relação está na 3ª forma normal (3FN) quando:
- estiver na 2FN;
- os atributos que não pertencem à chave não dependem de nenhum atributo que também não pertence à chave.
Passagem de uma relação à 3 FN:
- Separar os atributos que dependem de outro atributo não pertencente à chave, decompondo a relação em duas (ou mais) relações.

Forma Normal Boyce Codd
Caso especial 3FN é usada quando tem-se uma relação com varias chaves candidatas. Seu conceito diz que a relação está FNBC quando todo o determinante da relação for uma chave-candidata.

Quarta Forma Normal (4FN)
Uma relação está na 4ª forma normal (4FN) quando:
- estiver na 3FN;
- deve-se separar os atributos multidependentes.

Quinta Forma Normal (5FN)
São raros os casos de se necessitar da 5 ª FN pois a sua aplicação pode implicar em relações inválidas.

O SGBD para além de implementar o modelo de dados de um universo, deverá considerar alguns aspectos que permitem melhorias na utilização do sistema.
Trata-se de estabelecer um compromisso entre a flexibilidade do sistema e a viabilidade da sua utilização.
Pretende-se um esquema equilibrado que não ponha em risco a integridade da BD, mas que, simultane-amente, tenha um desempenho razoável. Por essa razão, na maioria dos casos, o processo de norma-lização pára na 3FN.

6) Dê exemplos de normalizações de uma relação.
Exemplo - Normalização de BDR

Exemplo Prático

Considere que um analista mapeou a nota para o seguinte esquema relacional:
nota_fiscal = {num_nota, cod_cliente, nome_cliente, logradouro_cliente,
telefone_cliente, data_nota_fiscal, (cod_produto, desc_produto, qtdade,
valor_produto, valor_total)}
Ao analisarmos esta relação, notamos que mesma causará problemas de
inconsistência de dados. Bem, para evitarmos futuros problemas, vamos
aplicar as formas normais e corrigir erros na relação.

Primeira forma normal:
A relação não está na 1FN pois existem atributos mutivalorados e compostos.
Vamos então passar para a 1FN:
nota_fiscal = {num_nota, cod_cliente, rua_cliente, bairro_cliente, cep_cliente,
cidade_cliente, telefone_cliente,data_nota_fiscal}

nota_produto = {num_nota, cod_produto, desc_produto, qtdade, valor_produto,
valor_total}

2. Segunda forma normal:
A relação não está na 2FN pois existem atributos com dependência parcial da
chave primária:

nota_fiscal = {num_nota, cod_cliente, rua_cliente, bairro_cliente, cep_cliente,
cidade_cliente, telefone_cliente, data_nota_fiscal}

nota_produto = {num_nota, cod_produto, qtdade, valor_total}

produto = {cod_produto, desc_produto, valor_produto}

3. Terceira forma normal:
A relação não está na 3FN pois existem atributos com dependência transitiva:

nota_fiscal = {num_nota, cod_cliente, data_nota_fiscal}

cliente = {cod_cliente, rua_cliente, bairro_cliente, cep_cliente, cidade_cliente,
telefone_cliente}

nota_produto = {num_nota, cod_produto, qtdade, valor_total}

produto = {cod_produto, desc_produto, valor_produto}

domingo, 29 de novembro de 2009

Algebra Relacional

1) Quantos e Quais são os grupos nos quais a álgebra relacional está dividida? Identifique quais operações pertencem a cada um deles.

A álgebra relacional poderá ser definida como o conjunto de operações que são necessárias efetuar para manipular relações.
Qualquer operação em álgebra relacional dará origem a uma nova relação, que poderá ser novamente manipulada.
A álgebra relacional é uma linguagem de interrogação procedimental, dado que o utilizador dá instruções para o sistema executar uma seqüência de operações na base de dados, para calcular o resultado esperado.

Operações sobre conjunto
União (U)
Intersecção(∩)
Diferença ( - )
Produto Cartesiano ( x )

Específicos de Álgebra Relacional
Seleção (σ)
Projeção (π)
Junção( x )
Divisão (÷)

2) Explique a Operação SELECT e PROJECT. Quando usar, Para que usar, Como usar, diferenças, etc.

Seleção (σ): O operador de seleção σ serve para selecionar um subconjunto de tuplas de uma relação baseado numa condição de seleção. Esta condição nos diz se uma tupla t deve ser incluída ou não na relação resultante. A operação SELECT é denotada por σ (). Na condição de seleção podemos colocar qualquer expressão booleana que envolva constantes, nomes de atributo da relação e comparações com >, < e = e podemos juntar expressões com OR, AND e NOT. Note que o operador é unário e que a relação resultante tem sempre um número menor ou igual de tuplas que a relação original. SELECT é um operador comutativo.

Projeção (π): O operador de projeção π é usado para selecionar atributos de uma relação e construir uma nova relação, "projetando" a relação antiga sobre os atributos escolhidos. A operação é denotada por πatributos (relação) e constrói uma relação nova que contém somente os atributos selecionados da antiga. Todo operador da álgebra relacional sempre gera como resposta uma relação válida. Assim, se não existirem chaves na lista de atributos, todas as ocorrências de tuplas duplicadas são excluídas, sobrando somente uma de cada tipo. A operação PROJECT não é comutativa.

3) Explique a Operação UNION, INTERSECTION e DIFFERENCE. Quando usar, Para que usar, Como usar, etc.

Union – União. Simbologia: - é realizada sobre dois ou mais conjuntos para se criar um outro conjunto que contenha todas as tuplas não comuns entre os conjuntos e as tuplas comuns entre os conjuntos, sem repeti-las.
Intersection - Intersecção. Simbologia: - é realizada sobre dois ou mais conjuntos tendo como resultado um outro conjunto que possuirá os valores que sejam comuns a todos os conjuntos da relação.
Difference - Diferença, Subtração. Simbologia: - - esta operação tem como resultados os valores que, entre dois conjuntos, existem em um, mas não existem no outro conjunto envolvido ;

4) Explique a Operação CARTESIAN PRODUCT. Quando usar, Para que usar, Como usar, etc.

Produto cartesiano

O resultado do produto cartesiano de duas tabelas é uma terceira tabela contendo todas as combinações possíveis entre os elementos das tabelas originais. Essa tabela resultante possuirá um número de colunas que é igual à soma das quantidades de colunas das duas tabelas iniciais, e um número de linhas igual ao produto do número de suas linhas. Portanto, se fizermos o produto cartesiano de uma tabela A que possua 4 colunas e 10 linhas com uma tabela B onde existem 3 colunas e 7 linhas, a tabela resultante terá 4+3= 7 colunas e 10*7= 70 linhas. Assim, cada linha dessa tabela corresponderá à concatenação de uma linha da primeira tabela com uma linha da segunda. O produto cartesiano não é muito usado como um fim em si mesmo, ou seja, dificilmente estaremos interessados em saber quais são todas as combinações possíveis entre as linhas de duas tabelas, pois a utilidade prática desse tipo de conhecimento é muito discutível. Entretanto, é a única forma primitiva de que dispomos para fundir informações de duas tabelas heterogêneas para posterior processamento. Nesse caso, tipicamente será necessário executar uma Seleção sobre o resultado do Produto Cartesiano, de maneira a descartar as combinações inválidas entre as linhas das tabelas originais

5) Explique as Operações de junção (JOIN) e divisão (DIVISION). Quando usar, Para que usar, Como usar, etc.

A operação JOIN x é um produto cartesiano seguido de uma operação e é capaz de processar relacionamentos entre relações, pois combina tuplas de mais de uma relação.
R=R1 x condição R2

A condição de seleção do JOIN é sobre ambas as relações e, no final da operação sobram somente as tuplas do produto cartesiano que obedecem a esta condição em uma relação com m+n atributos e no máximo mn tuplas.

DIVISÃO( )

A operação de divisão é bem mais complicada do que a de JOIN, pois envolve mais operações. Quando divido uma tabela R1 por outra R2, desejo selecionar conjuntos de tuplas que sejam iguais exceto pelos atributos de R2 e que cada grupo contenha todas as tuplas de R2. Se a explicação parece confusa, é por que é mesmo. A operação de divisão gera muitas dúvidas (uma aula praticamente só para ela.) e olhar alguns exemplos ajuda bastante. Se facilitar, ela é equivalente a seguinte sequência de operações (R ÷ S:
T1 = π y(R)
T2= π y(S x T1) – R
T= T1 – T2

6) Explique as Operações de AGREGAÇÃO. Quando usar, Para que usar, Como usar, etc.

Funções de agregação são aquelas que, quando aplicadas, tomam uma coleção de
valores e retornam um valor simples como resultado.
• SUM, AVERAGE, MAXIMUM, MINIMUM,
COUNT

Um tipo de requisição comum envolve o agrupamento de tuplas em uma relação pelo valor de alguns atributos e depois pela aplicação de uma função de agregação neste grupo.
Ex. Agrupar os empregados pelo número de seu departamento, e aplicar a função média no atributo salário em cada grupo. Desta forma saberemos a média dos salários dos empregados de cada departamento.

atributos_agrupados> Agreg (R)
- atributos_agrupados>
Lista de atributos de R

Lista de pares

SUM, AVERAGE, MAXIMUM, MINIMUM, COUNT

Atributo de R