MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE FEDERAL DE SANTA CATARINA

CENTRO TECNOLÓGICO

DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA

PROGRAMA DE ENSINO

1. Identificação

Disciplina:INE5664 - Aprendizado de Máquina
Nível:Graduação
Carga Horária:72 horas-aula (Teórica: 60; Prática: 12)
Vigência:De 2024-2 até a presente data

2. Ementa

Introdução, conceitos iniciais e aplicações. Fluxo de projeto de aprendizado de máquina. Fundamentos de aprendizado de máquina. Aprendizado não supervisionado. Aprendizado Supervisionado. Treinamento, avaliação e seleção de modelos.

3. Cursos Relacionados

4. Objetivos

4.1 Objetivo Geral:

Apresentar aos alunos os fundamentos da área de aprendizado de máquina, de forma que eles possam entender os algoritmos clássicos da área, bem como prepará-los para aplicar o conhecimento estudado em problemas práticos, identificando problemas recorrentes e propondo formas de contorná-los.

4.2 Objetivos Específicos:

  1. Introduzir um fluxo geral de projeto baseado em aprendizado de máquina focado em redução de overfitting.
  2. Apresentar as técnicas clássicas de aprendizado de máquina.
  3. Prover experiência prática com exercícios e um projeto final baseado na aplicação dos conhecimentos abordados.

5. Conteúdo Programático

  1. Conceitos Fundamentais [16 horas-aula]
    1. Introdução e conceitos iniciais
    2. Fluxo de projeto de aprendizado de máquina
    3. Regressão Linear/Logística
    4. Gradiente descendente
  2. Aprendizado não supervisionado [16 horas-aula]
    1. Principal Component Analysis (PCA)
    2. Clustering
  3. Aprendizado supervisionado [28 horas-aula]
    1. Aprendizado por raciocínio probabilístico
    2. Árvores de Decisão
    3. Máquinas de Vetores de Suporte (SVM)
    4. Perceptron
    5. Redes Neurais e o algoritmo de retropropagação
    6. Métodos de ensemble
    7. Seleção de Modelos
      1. Bias/Variance
      2. Técnicas de Regularização
      3. Separação de dados
      4. Validação Cruzada
  4. Projeto Final [12 horas-aula]

6. Bibliografia Básica

  1. AGGARWAL, Charu C. Data mining: the textbook. Springer, 2015.
  2. FRIEDMAN, Jerome et al. The elements of statistical learning. New York: Springer series in statistics, 2001.
  3. TAN, Pang-Ning; STEINBACH, Michael; KUMAR, Vipin. Introduction to data mining. Pearson Education India, 2018. ttps://www-users.cse.umn.edu/~kumar001/dmbook/index.php

7. Bibliografia Complementar

  1. DUBOUE, Pablo. The Art of Feature Engineering: Essentials for Machine Learning. Cambridge University Press, 2020.
  2. KAZIL, Jacqueline; JARMUL, Katharine. Data wrangling with Python: tips and tools to make your life easier. O'Reilly Media, Inc.", 2016.
  3. HAN, Jiawei; PEI, Jian; KAMBER, Micheline. Data mining: concepts and techniques. Elsevier, 2011.
  4. OSBORNE, Jason W. Best practices in data cleaning: A complete guide to everything you need to do before and after collecting your data. Sage, 2013.
  5. SKIENA, Steven S. The data science design manual. Springer, 2017.
  6. RUSSEL, Stuart J.; NORVIG, Peter. Artificial Intelligence: A Modern Approach, 4th edition, Pearson, 2021. http://aima.cs.berkeley.edu/global-index.html