filmeu

Disciplina Data Mining

  • Apresentação

    Apresentação

    A disciplina de Data Mining tem como objectivo dar ao estudante competências essenciais na análise de dados, numa perspetiva multidisciplinar, como se trata a Ciência de Dados. Através da apresentação de metodologias e técnicas fundamentais para tratar, transformar, construir e analisar os dados, é objectivo desta disciplina dar ao estudante capacidade para traduzir essa análise em conhecimento e valor, de modo sustentado para a tomada de decisão.   A componente prática é um dos aspetos fundamentais da disciplina, pelo que a capacidade de traduzir conhecimento em ações práticas e decisões de análise é particularmente valorizada. A ligação estreita ao mundo empresarial para resposta a perguntas de negócios será retratada nesta disciplina.
  • Conteúdos Programáticos

    Conteúdos Programáticos

    1. Introdução ao Data Mining:   Importância e aplicações de Data Mining Worflow de Projectos: Exemplos Práticos Tipos de dados: Estruturados, Semi-estruturados e não estruturados Principais desafios em Data Mining   2. Python para Data Mining   Setup: Jupyter notebook NumPy Pandas Matplotlib   3. Pré-processamento de dados   Limpeza e preparação de dados estruturados (data wrangling: slicing, grouby, pivoting, missing values, imputation, duplicates, outliers, etc) Tratamento de dados não estruturado - Texto (lemmatisation, stemming, etc.)   4. Introdução ao Machine Learning, modelos superviosionados e não superviosionados   Conceitos base Regressão Linear Regressão Logística KNN Redução de Dimensionalidade (PCA) Clustering Métricas de avaliação de desempenho de modelos
  • Objetivos

    Objetivos

    A disciplina tem como objetivos dar ao aluno as competências para:   OA1. Compreender a importância de Data Mining no mundo real OA2. Compreender a natureza dos dados OA3. Entender as principais técnicas e métodos, em programação Python, usados por cientistas de dados, através da sua prática OA4. Ser capaz de proceder a tarefas básicas de preparação e pré-processamento de dados OA5. Fazer análise exploratórias de dados com implementação em Python OA6. Entender o fluxo de trabalho de um cientista de dados e ser capaz de pensar sobre a solução de problemas com dados OA7. Entender e implementar métodos de aprendizagem automática, supervisionados e não supervisionados OA8. Conhecer as métricas de avaliação do desempenho de um modelo
  • Metodologias de ensino e avaliação

    Metodologias de ensino e avaliação

    Nas aulas, introduzem-se os conceitos teóricos que são complementados com exemplos práticos reais. Os alunos são incentivados a resolver exercícios assim como a apresentar quaisquer dúvidas. Para cada tópico é apresentado um conjunto de exercícios de aplicação dos conceitos teóricos, procedendo-se ao acompanhamento da resolução dos mesmos e apresentando-se a resolução final.   Materiais de apoio e exercícios com sugestões de resolução serão disponibilizados no Moodle.   Acredita-se que a avaliação contínua, adaptada de acordo com a evolução dos alunos, seja uma boa prática. O acompanhamento individual e a disponibilidade para esclarecer dúvidas, sempre que necessário, é essencial para o aluno e para o seu desempenho.
  • Bibliografia principal

    Bibliografia principal

    Grus, J. (2019). Dafa science from scratch: first princples with Python . O'ReiIIy Media.   Provost, F., Fawcett T. (2013) Data Science for Business: What you need to know about data mining and data-analytic thinking , O'Reilly Media Inc.
INSCRIÇÃO AVULSO
Lisboa 2020 Portugal 2020 Small financiado eu 2024 prr 2024 republica portuguesa 2024 Logo UE Financed Provedor do Estudante Livro de reclamaões Elogios