Objetivos de aprendizagem (conhecimentos, aptidões e competências a desenvolver pelos estudantes):
Desenvolvimento de capacidade autónoma de selecção e aplicação de diferentes métodos de colheita de dados, organização de dados, visualização e análise exploratória.
Pretende-se, com esta UC, e em conjunto com outras UCs obrigatórias, assegurar a independência dos alunos em âmbitos de investigação científica. Especificamente com esta UC os alunos deverão ser capazes de: i) compreender a importância de uma correcta gestão de dados na investigação científica, ii) seleccionar os métodos de colheita de dados apropriados, desenhando e implementando estes métodos de forma a obter dados completos e com qualidade, iii) classificar, transformar e limpar
dados de forma a promover a análise exploratória e a reprodutibilidade, iv) gerir ficheiros de dados de forma profissional e segura, e v) conduzir análise exploratória dos dados usando técnicas de análise multivariada e visualização, de forma a promover a formulação de hipóteses.
Conteúdos programáticos:
Módulo 1: Introdução aos dados
- História dos dados e a nova era do big data;
- Tipos de dados(estruturados, semiestruturados, não estruturados; discretos, contínuos; quantitativos, qualitativos);
- Frameword do ciclo de vida de dados para investigação;
- Bases de dados,modelos de dados e sistemas de gestão de informação;
- Ferramentas para coleta de dados, gestão de dados e análise de dados.
Módulo 2: Métodos de colheita de dados
- Metodos quantitativos;
- Métodos qualitativos;
- População e amostragem;
- Fontes de erro e viés.
Módulo 3: Organização e gestão de dados
- Classificação e categorização;
- Transformações de dados e limpeza de dados;
- Nomes de ficheiros, versionamento, formatos de ficheiros e documentação;
- Armazenamento, segurança, privacidade e partilha.
Módulo 4: Análise exploratória e visualização de dados
- Breve introdução à análise multivariada (variáveis aleatórias e funções de distribuição; momentos e matriz de covariância);
- Visualização de dados;
- Breve introdução ao PCA e análise de clusters.