Resumo do curso

A Introdução à aula de Ciências de dados vai discutir os tópicos fundamentais na ciência de dados, a saber:

  • Manipulação de Dados
  • Análise de Dados com Estatística e Aprendizado de Máquina
  • A comunicação de dados com visualização de informações
  • Dados em Escala - Trabalhando com Big Data

A aula cobrirá uma variedade de tópicos e os apresentará brevemente, em vez de se concentrar em um único tema em profundidade. Isto lhe dará a oportunidade de experimentar e aplicar as técnicas básicas da ciência de dados.

Este curso também é uma parte do nosso Nanodegree Analista de Dados.

Assistir ao Trailer
Valor do curso
Gratuito
Duração
Aprox. 2 meses
Nível
Intermediário
O curso inclui
  • Icon course 01Videoaulas

  • Icon course 04Testes interativos

  • Icon course 02Aulas com profissionais do setor

  • Icon course 05Ritmo individual de aprendizado

  • Icon course 03Comunidade de apoio aos alunos

Sua jornada de aprendizado

Este curso grátis é mais um passo rumo a uma carreira de sucesso. Conheça também o Programa Nanodegree Analista de Dados e vivencie a experiência completa de ser um aluno Udacity!

Curso Aberto

Introdução à Ciência de Dados

O Que é Preciso Para Se Tornar Um Cientista de Dados

Icon steps 54aa753742d05d598baf005f2bb1b5bb6339a7d544b84089a1eee6acd5a8543d

O que vou aprender?



Lição 1: Introdução à Ciência de dados

  • Introdução à Ciência de dados
  • O que é um cientista de dados
  • Pi-Chaun (Cientista de dados @ Google): O que é Ciência dados
  • Gabor (Cientista de dados @ Twitter):? O que é Ciência dados
  • Problema resolvidos Ciência dados
  • Pandas
  • Dataframes
  • Criar um novoDataframe

Lição 2: Tratamento de Dados

  • O que é tratamento de dados
  • A aquisição dos dados
  • Formatos de dados comuns
  • O que são bancos de dados relacionais?
  • Dados Aadhaar
  • Dados Aadhaar e bancos de dados relacionais
  • Introdução aos schemas do bases de dados
  • APIs
  • Dados em formato JSON
  • Como acessar uma API eficientemente
  • Valores em branco
  • Fácil imputação
  • Imputar usando regressão linear
  • Dica do imputação Iceberg

Lição 3: Análise de dados

  • Rigor estatístico
  • Kurt (Cientista de dados @ Twitter) - Por que estatística é útil
  • Introdução à distribuição normal
  • Teste T
  • Teste T de Welch
  • Testes não paramétricos
  • Dados não-normais
  • Estatística vs. Aprendizado de Máquina
  • Diferentes tipos de Aprendizado de Máquina
  • Predição com regressão
  • Função de custo
  • Como minimizar a Função Custo
  • Coeficientes de determinação

Lição 4: Visualização de Dados

  • Visualização de informação eficaz
  • Marcha de Napoleão na Rússia
  • Don (Cientista de Dados Chefe @ AT&T): comunicação dos resultados
  • Rishiraj (Cientista de Dados Chefe @AT&T): comunicando bem os resultados
  • Codificações visuais
  • Percepção de pistas visuais
  • Plotando em Python
  • Escalas de Dados
  • A visualização de dados em séries temporais

Lição 5: MapReduce

  • Big Data e MapReduce
  • Noções básicas de MapReduce
  • Mapper
  • Redutor
  • MapReduce com Dados Aadhaar
  • MapReduce com Dados do Metro

Que projetos vou fazer?



Projeto 1

Projeto Final

Neste projeto você vai ter tempo para refletir sobre algumas análises interessantes e visualizações de dados do metrô de Nova York e dados meteorológicos. Você vai responder a perguntas sobre por que você escolheu certos testes e por chegou em um determinado resultado.

Projeto Final

Neste projeto você vai ter tempo para refletir sobre algumas análises interessantes e visualizações de dados do metrô de Nova York e dados meteorológicos. Você vai responder a perguntas sobre por que você escolheu certos testes e por chegou em um determinado resultado.

Projeto 2

P1: Prevendo preços de imóveis de Boston

O mercado imobiliário Boston é altamente competitivo, e você quer ser o melhor agente imobiliário na área. Para competir com seus pares, você decide aproveitar alguns conceitos básicos de aprendizagem de máquina para ajudar você e um cliente a encontrar o melhor preço de venda de sua casa. Felizmente, você encontra um conjunto de dados imobiliários de Boston, que contém dados agregados de vários características para casas em comunidades de Boston, incluindo o valor médio das casas para cada uma dessas áreas. Sua tarefa é construir um modelo ideal com base em uma análise estatística com as ferramentas disponíveis. Este modelo será então usado para estimar o melhor preço de venda para a casa de seu cliente.

P1: Prevendo preços de imóveis de Boston

O mercado imobiliário Boston é altamente competitivo, e você quer ser o melhor agente imobiliário na área. Para competir com seus pares, você decide aproveitar alguns conceitos básicos de aprendizagem de máquina para ajudar você e um cliente a encontrar o melhor preço de venda de sua casa. Felizmente, você encontra um conjunto de dados imobiliários de Boston, que contém dados agregados de vários características para casas em comunidades de Boston, incluindo o valor médio das casas para cada uma dessas áreas. Sua tarefa é construir um modelo ideal com base em uma análise estatística com as ferramentas disponíveis. Este modelo será então usado para estimar o melhor preço de venda para a casa de seu cliente.

Instrutores & Parceiros

  • Dave Holtz
    Dave Holtz

    Instrutor

  • Cheng-Han Lee
    Cheng-Han Lee

    Instrutor

Pré-requisitos

Os estudantes ideais para esta aula são indivíduos preparados que têm:

  • Forte interesse na ciência de dados
  • Experiência prévia em estatísticas de nível de introdutório
  • Experiência de programação em Python
  • Ou compreensão de conceitos de programação como variáveis, funções, loops e estruturas de dados Python básicas, como listas e dicionários

Se você precisa rever alguns conceitos, recomendamos Introdução à Ciência da Computação: Construindo um Search Engine. Se você precisar de uma reciclagem sobre as estatística, inscreva-se no Introdução à Estatística Descritiva e Introdução à Estatística Inferencial. Todos os três estão na Udacity!

Veja os Requisitos Tecnológicos para usar a Udacity.

Por que fazer este curso?

Você terá a oportunidade de trabalhar com um projeto de ciência de dados do início ao fim, desde analisar um conjunto de dados para visualizar até comunicar sua análise de dados.

Através do trabalho no projeto desta aula, você será exposto e irá compreender as habilidades que são necessárias para se tornar um cientista de dados.

Quais são os recursos?
  • Vídeos dos instrutores
  • Exercícios práticos
  • Aulas com profissionais do setor