-
Apresentação
Apresentação
A presente Unidade Curricular visa a compreensão de conceitos associados à Ciência dos Dados (Data Science) orientados à biotecnologia e áreas similares. O aluno é introduzido à formulação matemática de ferramentas dos domínios da Estatística e Probabilidade, que possibilitam a implementação, desenvolvimento e interpretação, de scripts em linguagem Python. Neste sentido, através de mecanismos de aprendizagem supervisionada e não supervisionada, o aluno fica capacitado para gerar soluções que congreguem funcionalidades de processamento, análise e visualização de data sets relevantes, podendo estes ser extensivos (big data) ou não. Completa-se ainda a pertinência desta Unidade Curricular com o estudo e modelação de aplicações no domínio biotecnológico como a previsão de doenças em seres vivos, até efeitos em agriculturas modificadas geneticamente, com intuito de suportar a tomada de decisão quer em investigação académica ou em bionegócio.
-
Disciplina do curso
Disciplina do curso
-
Grau | Semestres | ECTS
Grau | Semestres | ECTS
Licenciado | Semestral | 5
-
Ano | Natureza | Lingua
Ano | Natureza | Lingua
3 | Opcional | Português
-
Código
Código
ULHT6643-22371
-
Pré-requisitos e co-requisitos
Pré-requisitos e co-requisitos
Não aplicável
-
Estágio Profissional
Estágio Profissional
Não
-
Conteúdos Programáticos
Conteúdos Programáticos
Introdução à Data Science em Biotecnologia Tópicos em Matemática orientada a Data Science Data Munging. Pontuações e Rankings. Análise Estatística Visualização de Dados Modelos Matemáticos em Data Science Álgebra Linear Métodos de Distância e Redes Machine Learning Big Data
-
Objetivos
Objetivos
É o principal objetivo desta Unidade Curricular dotar o aluno com as principais técnicas e princípios metodológicos da aquisição, processamento e interpretação de dados em biotecnologia, com recurso à computação via linguagem Python. Assim, o aluno será capaz de: compreender, implementar ou desenvolver modelos matemáticos quantitativos, classificativos e preditivos simples com base em data sets existentes; compreender, implementar ou desenvolver metodologias que assentem na aprendizagem autónoma computadorizada, via mecanismos supervisionados e não supervisionados; e aplicar a linguagem de programação Python no âmbito da Data Science para resolver e inferir sobre problemáticas na área da biotecnologia.
-
Metodologias de ensino e avaliação
Metodologias de ensino e avaliação
Nas aulas teóricas são apresentados os conteúdos do programa, com recurso a apresentações e simulações, estimulando a discussão entre os alunos e docente. Nas aulas teórico-práticas, os alunos resolvem exercícios com transição progressiva de complexidade. A avaliação pode ser contínua ou não contínua. A avaliação contínua compreende prova escrita (componente teórica, CT) e entrega de dois exercícios resolvidos durante o semestre (componente teórico-prática, CTP). A CT consiste na realização de duas frequências ou de um exame. A CTP consiste na entrega de dois exercícios resolvidos via Moodle, não havendo nota mínima. A nota final à Unidade Curricular, resulta do cálculo: Nota Final = 50% CT + 50% CTP, onde CT e CTP são respetivamente as médias das provas prestadas no âmbito de cada componente. Alternativamente, o aluno pode no início do semestre selecionar o modo de avaliação não contínua. Assim, o aluno é submetido a exame, tendo este que ter nota mínima de 9.5 para aprovação.
-
Bibliografia principal
Bibliografia principal
Trevor Hastie, Robert Tibshirani, Jerome Friedman (2009) The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd edition. Springer (ISBN-13: 978-0387848570) Laura Igual, Santi Segui (2017) Introduction to Data Science: A Python Approach to Concepts, Techniques, and Applications. 1st edition. Springer (ISBN-13: 978-3319500164)
-
Horário de Atendimento
Horário de Atendimento
-
Mobilidade
Mobilidade
Não