Considerações iniciais da área e aplicações. Processos de descoberta do conhecimento (KDD) em base de dados. Análise exploratória de dados. Tipos de variáveis, Técnicas de Data Mining para classificação, estimação, predição, análise de agrupamentos, análise de associação: redes neurais, árvores de decisão, regras de decisão, análise discriminante, regressão linear, regressão logística, análise de cluster, análise de componentes principais. Uso de softwares de data mining. Exercícios. Data Mining de caso.
3. Cursos Relacionados
CIÊNCIAS DA COMPUTAÇÃO (208) - Currículo: 2007-1 (Optativa)
ENGENHARIA DE CONTROLE E AUTOMAÇÃO (220) - Currículos: 1991-1 (Optativa); 2024-1 (Optativa)
SISTEMAS DE INFORMAÇÃO (noturno) (238) - Currículo: 2000-1 (Obrigatória)
4. Objetivos
4.1 Objetivo Geral:
Apresentar e aplicar as principais técnicas de mineração de dados, o processo de KDD com vistas à identificação de padrões importantes e não óbvios em grandes bancos de dados.
4.2 Objetivos Específicos:
Assimilar os principais conceitos acerca de Mineração de Dados (MD);
Compreender os passos do processo de descoberta de conhecimento em base de dados (KDD);
Realizar a análise exploratória dos dados;
Compreender as principais tarefas da mineração de dados e relacionar as respectivas técnicas;
Conhecer e saber aplicar as principais técnicas de mineração de dados (classificação, agrupamentos, estimação, predição e associação);
Utilizar ferramenta para uso de algoritmos de mineração de dados.
5. Conteúdo Programático
Introdução e Conceitos [6 horas-aula]
O que é KDD
Tarefas, processos e técnicas
Processo KDD [6 horas-aula]
As etapas do processo KDD
Análise Estatística de Dados [8 horas-aula]
Estatística descritiva dos dados
Normalização de dados
Transformação de dados
Classificação [12 horas-aula]
Abordagem simbólica
Algoritmo ID3
Algoritmo C45
Abordagem estatística
Algoritmo de Naive-Bayes
Abordagem conexionista
Redes Neurais artificiais (MLP e RBF)
Uso de ferramenta
Trabalho prático
Agrupamento [10 horas-aula]
Algoritmos de clustering convencionais (Kmeans)
Algoritmos hierárquicos (Dendogramas)
Trabalho prático
Associação [10 horas-aula]
Algoritmo apriori (regras de associação)
Trabalho prático
Tópicos Avançados [10 horas-aula]
Seminários sobre tópicos atuais
Projeto [10 horas-aula]
6. Bibliografia Básica
WITTEN, I. H. et al. Data Mining: Practical Machine Learning Tools and Techniques. 4a Edição. Amsterdam: Morgan Kaufmann, 2017.
IGUAL, L. et al. Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications. 1.ed. Springer Publishing Company, Incorporated, 2017
SKIENA, S. S. The Data Science Design Manual. 1.ed. Springer Publishing Company, Incorporated, 2017.
BRAMER, M. Principles of Data Mining. 3.ed. Springer Publishing Company, Incorporated, 2016.
AGGARWAL, C. C. Data Mining: The Textbook. Springer Publishing Company, Incorporated, 2015
7. Bibliografia Complementar
TAN, P. et al. Introduction to Data Mining. 2.ed. Pearson, 2018.
AMARAL,F.C.N. Data Mining: Técnicas e Aplicações para o Marketing Direto. São Paulo: Editora Berkeley, 2001.