Logo PECE. Pular para página inicial
 

Ementa da Disciplina

CódigoTDS-001
DisciplinaBig Data e Governança de Dados
Objetivo

 Compreender o conceito de Big Data. 
 Identificar as técnicas e tecnologias existentes em cada fase de um projeto de Big Data (Captura, armazenamento, processamento, análise e visualização de dados). 
 Identificar casos de uso de soluções de Big Data aplicado à sustentabilidade. 
 Identificar os processos e práticas existentes na governança de dados no contexto de Big Data. 
 Executar exemplos práticos da adoção de tecnologias de Big Data no processo de análise de dados 

Público_Alvo
O público alvo são gestores, lideres de projetos e profissionais, usuários ou geradores de soluções baseadas em Tecnologias Digitais e orientados a metas de desempenho do negócio e/ou sustentabilidade.
    
Ementa

1. Introdução a Big Data 
1.1. Definição de Big Data. 
1.2. Oportunidades e desafios existentes. 
1.3. O perfil do profissional cientista de dados. 
1.4. Big Data e sustentabilidade. 
1.5. As fases de um projeto de Big Data. 
2. Governança de Dados na Era de Big Data 
2.1. O papel do Chief Data Officer - CDO. 
2.2. Processos chaves da Governança de Dados 
2.3. Frameworks de Governança de Dados 
2.4. Silos de Dados versus Data Lake 
3. Projeto de Big Data - Fase de captura e armazenamento de dados 
3.1. Dados internos e dados externos 
3.2. APIs para captura de dados 
3.3. Tecnologia NoSQL versus banco de dados relacional 
4. Projeto de Big Data - Fase de processamento dos dados 
4.1. Descobrindo o Hadoop 
4.2. Armazenamento de dados no Hadoop 
4.3. O modelo de programação MapReduce 
4.4. Aplicabilidade do Hadoop 
4.5. Casos de uso 
5. Projeto de Big Data - Fase de análise de dados 
5.1. As 4 categorias de analytics 
5.2. Técnicas de mineração de dados 
5.3. Técnicas de aprendizado de máquina 
5.4. Uso da linguagem R 
6. Projeto de Big Data - Fase de visualização de dados 
6.1. Obtendo desempenho com a visualização de dados 
6.2. Técnicas de visualização de dados 
6.3. Casos de uso inspiradores 

Bibliografia

1. MARQUESONE, R. Big Data - Técnicas e Tecnologias para Extração de Valor dos Dados. Casa do Código, São Paulo, 2016. 
2. GOLDMAN, Alfredo et al. Apache Hadoop: conceitos teóricos e práticos, evolução e novas possibilidades. XXXI Jornadas de atualizaçoes em informatica, p. 88-136, 2012. 
3. PROVOST, Foster; FAWCETT, Tom. Data Science for Business: What you need to know about data mining and data-analytic thinking. " O'Reilly Media, Inc.", 2013. 
4. MCCREARY, Dan; KELLY, Ann. Making sense of NoSQL. Shelter Island: Manning, p. 19-20, 2014. 
5. WHITE, Tom. Hadoop: The definitive guide. " O'Reilly Media, Inc.", 4ed, 2015. 
6. MANYIKA, James et al. Big data: The next frontier for innovation, competition, and productivity. 2011. 
7. SOARES, Sunil. The chief data officer handbook for data governance. Mc Press, 2015. 
8. TALLON, Paul P. Corporate governance of big data: Perspectives on value, risk, and cost. Computer, v. 46, n. 6, p. 32-38, 2013.

Duração (h)18
Título Escolha
Imagem do selo de Garantia de Qualidade POLI
Centro de Apoio ao Aluno: atendimento@pecepoli.com.br
Telefone: (11) 2998-0000 Fax: (11)2998-0054
Segunda a sexta-feira das 9h00 às 21h00.
Logo da USP - link externo ©Copyright 2010 PECE - Todos direitos reservados. Logo da Escola Politécnica - link externo