-
Apresentação
Apresentação
A disciplina de Técnicas de Data Warehouse tem como objetivo fundamental apresentar ao estudante a importância de uma arquitetura de Data Warehouse e o seu impacto nas soluções de dados do mundo empresarial. Esta unidade curricular irá apresentar aos alunos as motivações da génese do Data Warehouse, das suas caraterísticas principais no armazenamento e modelação dos dados, assim como das mais recentes soluções como o Data Lake e Data Lakehouse aplicadas pelas grandes tecnológicas. Na componente prática, o aluno terá a oportunidade de aplicar os conceitos leccionados na componente teórica, numa tecnologia bastante valorizada no mercado de trabalho atual.
-
Disciplina do curso
Disciplina do curso
-
Grau | Semestres | ECTS
Grau | Semestres | ECTS
Mestre | Semestral | 7
-
Ano | Natureza | Lingua
Ano | Natureza | Lingua
1 | Obrigatório | Português
-
Código
Código
ULHT457-13318
-
Pré-requisitos e co-requisitos
Pré-requisitos e co-requisitos
Não aplicável
-
Estágio Profissional
Estágio Profissional
Não
-
Conteúdos Programáticos
Conteúdos Programáticos
Aulas Teóricas Tendências em Dados e Analytics Arquitetura Data Warehouse Modelação Multidimensional Técnicas de Data Warehouse Transformação e Exploração Aulas Práticas Introdução ao Databricks e ao Apache Spark Ingestão e Preparação de Dados no Databricks Transformação de Dados e Construção de um Star Schema ETL Avançado e Carregamento de Dados em Data Warehouses Consulta e Visualização de Dados no Databricks
-
Objetivos
Objetivos
Na conclusão do curso, o aluno deverá: Entender a necessidade de um Data Warehouse em contexto empresarial e descrever a sua relação com as aplicações existentes de dados (business intelligence, data analytics) Conhecer as metodologias de implementação de um Data Warehouse e saber discernir quais as melhores técnicas a utilizar face aos processos de negócios específicos Descrever a diferença de uma arquitetura de Data Warehouse de outras arquiteturas emergentes como o Data Lake, e saber decidir qual o tipo de arquitetura a aplicar face às necessidades do negócio Praticar engenharia e estrutura de dados numa plataforma em cloud (Databricks)
-
Metodologias de ensino e avaliação
Metodologias de ensino e avaliação
O ensino está repartido entre aulas teóricas e práticas. A avaliação baseia-se em: Projeto (50%) de construção de um modelo relacional a partir de um conjunto de dados e apresentação de um relatório; Teste/Exame final (50%) com perguntas de escolha múltipla e de desenvolvimento. Para aprovação, a nota do projeto deve ser superior a 9.5 e a do teste final ser superior a 9.5.
-
Bibliografia principal
Bibliografia principal
Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (Third Edition). Indianapolis, IN: John Wiley & Sons, Inc.
-
Horário de Atendimento
Horário de Atendimento
-
Mobilidade
Mobilidade
Não