Resumo do curso

Aprendizado de Máquina é um bilhete de primeira classe para as carreiras mais excitantes na análise de dados hoje. A medida em fontes de dados proliferam, juntamente com o poder de computação para processá-los, a análise de dados se torna cada vez mais simples a aquisição rápida de e previsões.

A aprendizado automática reúne a ciência da computação e estatística para aproveitar esse poder preditivo. É uma habilidade essencial para todos os aspirantes a analistas de dados e cientistas de dados, ou qualquer outra pessoa que queira destrinchar dados brutos e transformá-los em tendências e previsões refinadas.

Esta é uma aula que vai ensinar-lhe o processo, do início ao fim, de investigação de dados através do aprendizado de máquina. Ela vai ensiná-lo como extrair e identificar características úteis que melhor representam os seus dados, alguns dos mais importantes algoritmos de aprendizado de máquina, e como avaliar o desempenho de seus algoritmos de aprendizado de máquina.

Este curso também é uma parte do nosso Nanodegree Analista de Dados.

Assistir ao Trailer
Valor do curso
Gratuito
Duração
Aprox. 10 semanas
Nível
Intermediário
O curso inclui
  • Icon course 01Videoaulas

  • Icon course 04Testes interativos

  • Icon course 02Aulas com profissionais do setor

  • Icon course 05Ritmo individual de aprendizado

  • Icon course 03Comunidade de apoio aos alunos

Sua jornada de aprendizado

Este curso grátis é mais um passo rumo a uma carreira de sucesso. Conheça também o Programa Nanodegree Analista de Dados e vivencie a experiência completa de ser um aluno Udacity!

Curso Aberto

Introdução ao Aprendizado de Máquina

Reconhecimento de Padrões para diversão e lucro

Icon steps 54aa753742d05d598baf005f2bb1b5bb6339a7d544b84089a1eee6acd5a8543d

O que vou aprender?



Você vai aprender como começar com uma pergunta e/ou um conjunto de dados e utilizar o aprendizado de máquina para transformá-los em insights.

Lições 1-4: Classificação Supervisionada

Naive Bayes: De cara, aprenderemos o que seja, talvez, o maior algoritmo do mundo para a classificação de texto.

Support Vector Machines (SVMs): Um dos 10 melhores algoritmos de aprendizado de máquina e um candidato para muitas tarefas de classificação. O que o torna especial? A capacidade de gerar novos recursos de forma independente e em tempo real.

Árvores de Decisão: Extremamente simples, muitas vezes tão preciso quanto uma SVM, mas (geralmente) mais rápido. O ponto de partida para métodos mais sofisticados, como random forests and boosting.

Lição 5: Os Conjuntos de Dados e Perguntas

Por trás de qualquer grande projeto de aprendizado de máquina há um grande conjunto de dados com o qual o algoritmo pode aprender. Nós fomos inspirados por um valioso conjunto de dados de de e-mail e dados financeiros da Enron, que, normalmente, seriam estritamente confidenciais, mas se tornou público quando a empresa faliu com inúmeras fraudes. Sigam-noso à medida que lidamos com este conjunto de dados e o preparamos para o uso do aprendizado de máquina, para tentar prever casos de fraude

Lição 6 e 7: Regressões e Outliers

As regressões são alguns dos algoritmos de aprendizado de máquina mais amplamente utilizados, e com razão compartilham esse destaque com a classificação. O que é uma maneira rápida de cometer erros em regressão? Ter valores atípicos e problemáticos em seus dados. Vamos abordar como identificar e limpar esses outliers.

Lição 8: Aprendizado Não Supervisionado

Agrupamento K-Means:O principal algoritmo quando você não têm dados rotulados com que trabalhar e um método rápido para busca de padrões quando trabalha com um conjunto de dados pela primeira vez.

Lições 9-12: Recursos, Recursos, Recursos

Criação de Recurso: Use sua intuição humana sobre o mundo e transforme-o em dados que um computador pode usar

Seleção de Função: Einstein disse: fazer tudo o mais simples possível, e não mais simples. Neste caso, isso significa identificar as características mais importantes de seus dados

Análise de Componentes Importantes: Uma mais sofisticada seleção de características, e uma das jóias da coroa da aprendizagem não supervisionada.

Dimensionamento de Recursos: Truques simples para garantir coesão entre seus dados e o algoritmo.
Aprender com texto:. Mais informações existe em texto do que qualquer outro formato, e existem algumas ferramentas eficazes, mas simples para extrair essas informações

Lessons 13-14:. Validação e Avaliação

Treino/testes de separação de dados: Como você sabe que o que você está fazendo está funcionando? Você não sabe, a menos que valide. A divisão de treino-teste é simples de fazer, e o padrão importante para a compreensão de seus resultados.

Validação Cruzada: Pegue a divisão de treinamento / teste e melhore-os. Valide os seus resultados de aprendizado de máquina como um profissional.

Precisão, recall e F1 Score: Depois de todo esse trabalho orientado a dados, quantificar seus resultados com métricas sob medida para o que é mais importante para você.

Lição 15: Concluindo tudo isto

Nós daremos um passo para trás e rever o que aprendemos, e como tudo se encaixa.

Projetos

Mini-projeto no final de cada aula

Projeto Final: m busca de sinais de fraude corporativa em dados da Enron.


Que projetos vou fazer?



Projeto 1

P5: Identifique Fraudes Usando Emails da Enron

Trabalhe como detetive e use suas habilidades de aprendizado de máquina para construir um algoritmo para identificar funcionários da Enron que possam ter cometido fraude com base no conjunto de dados públicos financeiros e de e-mail da Enron.

P5: Identifique Fraudes Usando Emails da Enron

Trabalhe como detetive e use suas habilidades de aprendizado de máquina para construir um algoritmo para identificar funcionários da Enron que possam ter cometido fraude com base no conjunto de dados públicos financeiros e de e-mail da Enron.

Instrutores & Parceiros

  • Katie Malone
    Katie Malone

    Instrutor

  • Sebastian Thrun
    Sebastian Thrun

    Instrutor

Pré-requisitos

Para ter sucesso neste curso, você deve ser proficiente em programação em Python e estatísticas básicas. Se você precisar de uma reciclagem sobre qualquer um desses tópicos, você pode verificar esses cursos:

Um curso adicional que seria bom fazer é a Introdução à Ciência Dados, para familiarizá-lo com a resolução de problemas científicos. No entanto, a conclusão dessa aula não é necessária para ter sucesso. Também vamos usar um pouco de git, que você também pode aprender na Udacity.

Uma coisa que não exigem é a exposição prévia ao aprendizado de máquina. Se você é um novato aprendizagem de máquina, você está no lugar certo.

Veja os Requisitos Tecnológicos para usar a Udacity.

Por que fazer este curso?

Neste curso, você vai aprender fazendo! Nós vamos dar vida ao aprendizado de máquina, mostrando-lhe casos de uso fascinantes e como resolver problemas interessantes do mundo real, como carros de auto-condução. Para o seu projeto final você vai minerar as caixas de entrada de e-mail e dados financeiros da Enron para identificar as pessoas de interesse em um dos maiores casos de fraude corporativa da história americana.

Ao fim deste curso introdutório, você será capaz de analisar dados usando técnicas de aprendizado de máquina, e você também vai estar preparado para fazer o nosso Nanodegree Analista de Dados. Vamos iniciar a sua jornada de aprendizado de máquina, ensinando-lhe como usar ferramentas úteis, tais como algoritmos e bibliotecas pré-escritas, para responder a perguntas interessantes.

Quais são os recursos?
  • Vídeos dos instrutores
  • Exercícios práticos
  • Aulas com profissionais do setor