Curso Aberto

Aprendizado por Reforço

feito por

Georgia Institute of Technology

Estude aprendizado de máquina mais a fundo e torne-se um participante na comunidade de pesquisa de aprendizado por reforço.

Inicie o curso grátis

Resumo do curso

Você deve fazer este curso se você tiver interesse no aprendizado de máquina e desejo de se envolver com isso a partir de uma perspectiva teórica. Através de uma combinação de estudos clássicos e trabalhos mais recentes, você irá explorar a tomada de decisões automatizada a partir de uma perspectiva de ciência da computação. Você vai examinar algoritmos eficientes, caso existam, para um único agente e planejamento multi-agente, bem como abordagens ao aprendizado para decisões quase ideais através de experiência. No final do curso, você vai replicar os resultadso de um artigo publicado sobre aprendizado por reforço.

Valor do curso
Gratuito
Duração
Aprox. 4 meses
Nível
Avançado
O curso inclui
  • Icon course 01Videoaulas

  • Icon course 04Testes interativos

  • Icon course 02Aulas com profissionais do setor

  • Icon course 05Ritmo individual de aprendizado

  • Icon course 03Comunidade de apoio aos alunos

O que vou aprender?



  • Reforço aprender noções básicas
  • Introdução ao BURLAP
  • TD Lambda
  • Convergência de Valor e Política de iteração
  • Modelagem de Recompesa
  • Exploração
  • Generalização
  • MDPs Parcialmente Observáveis
  • Opções
  • Tópicos em Teoria dos Jogos
  • Outros temas em Modelos RL

Que projetos vou fazer?



Projeto 1

P4: Treine um Táxi Inteligente Como Dirigir

Um táxi inteligente é um carro de auto-condução de um futuro não tão distante que transporta as pessoas de um local arbitrário para outro. Neste projeto, você vai usar o aprendizado por reforço para treine um táxi inteligente como dirigir.

P4: Treine um Táxi Inteligente Como Dirigir

Um táxi inteligente é um carro de auto-condução de um futuro não tão distante que transporta as pessoas de um local arbitrário para outro. Neste projeto, você vai usar o aprendizado por reforço para treine um táxi inteligente como dirigir.

Instrutores & Parceiros

  • Charles Isbell
    Charles Isbell

    Instrutor

  • Michael Littman
    Michael Littman

    Instrutor

  • Chris Pryby
    Chris Pryby

    Instrutor

Pré-requisitos

Antes de fazer este curso, você deveria ter feito um curso de graduação em aprendizado de máquina e deve ter tido alguma exposição ao aprendizado por reforço de um curso anterior ou seminário em ciência da computação (estudantes que tenham concluído o CS 7641 estarão bem preparados para este curso).

Além disso, você estará programando extensivamente em Java durante este curso. Se você não estiver familiarizado com Java, recomendamos que você reveja a Introdução à Programação Java da Udacity para chegar preparado.

Veja os Requisitos Tecnológicos para usar a Udacity.

Por que fazer este curso?

Este curso irá prepará-lo para participar da comunidade de pesquisa de aprendizado por reforço. Você também terá a oportunidade de aprender com dois dos principais especialistas neste campo de pesquisa, Profs. Charles Isbell e Michael Littman.

Quais são os recursos?
  • Vídeos dos instrutores
  • Exercícios práticos
  • Aulas com profissionais do setor