MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE FEDERAL DE SANTA CATARINA

CENTRO TECNOLÓGICO

DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA

PROGRAMA DE ENSINO

1. Identificação

Disciplina:INE5643 - Data Warehouse
Nível:Graduação
Carga Horária:72 horas-aula (Teórica: 48; Prática: 24)
Vigência:De 2020-2 até a presente data

2. Ementa

Conceitos básicos. Os Ecossistemas de Informação. O Ciclo de Vida do DW: Planejamento e Administração, Levantameto de Requisitos, Modelagem Dimensional, Projeto Físico, o Back-Room e o Froon-Room, Metadados, Arquiteturas, Implementação, Segurança e Internet. Implantação, Suporte e Treinamento.

3. Cursos Relacionados

4. Objetivos

4.1 Objetivo Geral:

Fornecer conhecimentos teóricos e práticos sobre data warehouses e tendências recentes como data lakes e ciência de dados, habilitando o aluno a aplicar os conhecimentos obtidos na concepção, construção e operação de Data Warehouses, data marts e data lakes para análise de informação.

4.2 Objetivos Específicos:

  1. Assimilar os principais conceitos acerca da tecnologia de Data Warehouse (DW);
  2. Compreender as principais metodologias de desenvolvimento de DW;
  3. Conhecer e saber aplicar a modelagem dimensional (esquemas estrela e floco de neve);
  4. Aprender a implementar processos de Extração, Transformação e Carga de Dados (ETL/ELT).
  5. Saber efetuar análises de dados com Processamento Analítico OnLine (OLAP).
  6. Compreender o estado da arte e as tendências atuais em data warehouses, data lakes e análise de dados, utilizando inclusive algumas técnicas e ferramentas da ciência de dados.

5. Conteúdo Programático

  1. Introdução [8 horas-aula]
    1. Dos dados a informação.
  2. A Evolução dos SADs [4 horas-aula]
    1. Histórico
    2. SGDBs e Sistemas transacionais
  3. Ecossistemas de Informação [8 horas-aula]
    1. Business Intelligence
    2. Business Managment
    3. Business Operacional
  4. O Ciclo de Vida do DW [16 horas-aula]
    1. Planejamento do DW
      1. Escopo do projeto
      2. Plano do projeto
    2. Administração
    3. Definição de requisitos
    4. Questionários para entrevistas e sessões coordenadas
  5. Modelagem Dimensional [8 horas-aula]
    1. Passos para construção do esquema estrela
    2. Técnicas básicas
    3. Técnicas avançadas
  6. Back Room (ETL) [4 horas-aula]
    1. Extração, Transformação e Carga
    2. Área de estagiamento
    3. Ferramentas open source
  7. Front Room (OLAP) [8 horas-aula]
    1. Rolap, Molap, Holap, Dolap e Wolap
    2. Ferramentas e seu uso
  8. Projeto Final [16 horas-aula]

6. Bibliografia Básica

  1. KIMBALL, Ralph. The data warehouse lifecycle toolkit: expert methods for designing, developing, and deploying data warehouses. 2nd edition. New York: John Wiley & Sons, 2011. 672p. ISBN 978-1-118-07956-0

7. Bibliografia Complementar

  1. INMON, Willian H. Builging the data warehouse. 3rd ed New York: J. Wiley, c2002. 412p. ISBN 0471081302 (1 exemplar na BU)
  2. KIMBALL, Ralph. The data warehouse lifecycle toolkit: expert methods for designing, developing, and deploying data warehouses. New York: John Wiley & Sons, c1998. 771p. ISBN 0471255475 (4 exemplares na BU)
  3. KIMBALL, R. & ROSS, M. The Data Warehouse Toolkit. The Complete Guide to Dimensional Modeling. Second Edition, John Wiley & sons, Inc., New York, 2002.
  4. GOLFARELLI, M. & RIZZI, S. Data Warehouse Design: Modern Principles and Methodologies (1st. ed.). McGraw-Hill, Inc., USA, 2009.
  5. MOSS, L. T. & ATRE, S. Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support Applications. Boston, MA - Addison-Wesley Information Technology Series, 2003. ISBN: 0201784203
  6. MACHADO, F. N. Tecnologia e projeto de Data Warehouse: uma visão multidimensional. São Paulo: Érica, 2004.
  7. TURBAN, E.; SHARDA, R.; ARONSON, J.; KING, D. BUSINESS INTELLIGENCE: um enfoque gerencial para a inteligência do negócio. Porto Alegre: Bookman, 2009.
  8. SHARMA, B. Architecting Data Lakes, 2nd Edition, O'Reilly Media, Inc. 2018. ISBN: 9781492032991
  9. GORELIK, A. The Enterprise Big Data Lake, O'Reilly Media, Inc., 2019. ISBN: 9781491931554.
  10. LAURENT, A.; LAURENT, D.; MADERA, C. Data Lakes, Volume 2. Wiley 2020. Print ISBN:9781786305855 Online ISBN:9781119720430.