Colheita e Organização de Dados

8 ECTS / 1º Semestre / Português

Objetivos de aprendizagem (conhecimentos, aptidões e competências a desenvolver pelos estudantes):

Desenvolvimento de capacidade autónoma de selecção e aplicação de diferentes métodos de colheita de dados, organização de dados, visualização e análise exploratória.

Pretende-se, com esta UC, e em conjunto com outras UCs obrigatórias, assegurar a independência dos alunos em âmbitos de investigação científica. Especificamente com esta UC os alunos deverão ser capazes de: i) compreender a importância de uma correcta gestão de dados na investigação científica, ii) seleccionar os métodos de colheita de dados apropriados, desenhando e implementando estes métodos de forma a obter dados completos e com qualidade, iii) classificar, transformar e limpar
dados de forma a promover a análise exploratória e a reprodutibilidade, iv) gerir ficheiros de dados de forma profissional e segura, e v) conduzir análise exploratória dos dados usando técnicas de análise multivariada e visualização, de forma a promover a formulação de hipóteses.

Conteúdos programáticos:

Módulo 1: Introdução aos dados

  • História dos dados e a nova era do big data;
  • Tipos de dados(estruturados, semiestruturados, não estruturados; discretos, contínuos; quantitativos, qualitativos);
  • Frameword do ciclo de vida de dados para investigação;
  • Bases de dados,modelos de dados e sistemas de gestão de informação;
  • Ferramentas para coleta de dados, gestão de dados e análise de dados.

Módulo 2: Métodos de colheita de dados

  • Metodos quantitativos;
  • Métodos qualitativos;
  • População e amostragem;
  • Fontes de erro e viés.

Módulo 3: Organização e gestão de dados

  • Classificação e categorização;
  • Transformações de dados e limpeza de dados;
  • Nomes de ficheiros, versionamento, formatos de ficheiros e documentação;
  • Armazenamento, segurança, privacidade e partilha.

Módulo 4: Análise exploratória e visualização de dados

  • Breve introdução à análise multivariada (variáveis aleatórias e funções de distribuição; momentos e matriz de covariância);
  • Visualização de dados;
  • Breve introdução ao PCA e análise de clusters.