Explicando o aprendizado supervisionado para uma criança (ou seu chefe)

Cassie Kozyrkov
4 min readDec 17, 2020

--

Traduzido por Andre Belem do original de Cassie Kozyrkov e editado por Lia Carrari

Agora que você sabe o que é aprendizado de máquina, vamos encontrar o tipo mais fácil. Meu objetivo aqui é tornar humanos de todas as faixas e (quase) de todas as idades confortáveis com o jargão básico: instância, rótulo, feições, modelo, algoritmo e aprendizado supervisionado.

Instância

Eis as quatro instâncias!

As instâncias também são chamadas de “exemplos” ou “pontos de dados” ou “observações”.

Tabela de dados

Como são esses exemplos quando os colocamos em uma tabela? Seguindo a convenção (porque boas maneiras são boas), cada linha é uma instância.

Os dados não são bonitos? Mas o que exatamente estamos olhando? Vamos começar com duas colunas especiais: um ID exclusivo e, como temos sorte desta vez, um rótulo para cada instância.

Rótulos

O rótulo é a resposta certa. É o que gostaríamos que o computador aprendesse a exibir quando mostrássemos uma fotografia como essa, e é por isso que algumas pessoas preferem o termo “alvo”, “saída” ou “resposta”.

Feições

O que há nas outras colunas? Cores de pixel. Ao contrário de você, o computador vê as imagens como números, não como luzes bonitas. O que você vê são os valores de vermelho, verde e azul dos pixels, começando no canto superior esquerdo da imagem e descendo. Não acredita em mim? Tente inserir os valores da minha tabela de dados nessa tabela de cores RGB e veja quais cores ela fornece. Deseja saber como obter os valores de pixel de uma foto? Olhe por cima do meu ombro o meu código aqui.

Você sabe o que é muito legal? Toda vez que você olha para uma fotografia digital, está analisando dados, entendendo o sentido de algo que é armazenado como vários números. Não importa quem você é, você já é um analista de dados. Você estrela do rock, você!

Você já é um analista de dados!!

Esses valores de pixel são entradas das quais o computador aprenderá. Não sou um grande fã do nome do aprendizado de máquina para eles (“recursos”) porque essa palavra significa todo tipo de coisa em todos os tipos de disciplinas. Você pode ver pessoas usando outras palavras: “entradas”, “variáveis” ou “preditores”.

Modelo e algoritmo

Nossos recursos formarão a base do modelo (que é uma palavra chique para uma receita) que o computador usará para passar das cores dos pixels aos rótulos.

Um modelo é apenas uma palavra chique para “receita”.

Mas como? Esse é o trabalho do algoritmo de aprendizado de máquina. Você pode ver como ele funciona nos bastidores no meu outro artigo, mas, por enquanto, vamos usar um algoritmo incrível e existente: seu cérebro!

Aprendizado supervisionado

Gostaria que você fosse meu sistema de aprendizado de máquina. Olhe para as instâncias novamente e aprenda um pouco! O que é isso?

Classifique esta imagem usando o que aprendeu nos exemplos acima.

Um “Bizonho”? Sim. Você conseguiu ! O que você acabou de fazer foi um aprendizado supervisionado, incrível! Você já experimentou o tipo de aprendizado mais fácil que existe. Se você conseguir enquadrar seu problema como aprendizado supervisionado, essa é uma boa ideia. Os outros tipos são mais difíceis … então vamos conhecer um outro tipo: aprendizado não supervisionado.

Resumo: você está lidando com o aprendizado supervisionado se o algoritmo tiver o rótulo correto à mão para todas as instâncias. Mais tarde, ele usará o modelo, ou receita, para rotular novas instâncias, como você fez.

Caixa do Jargão: Instância = exemplo. Rótulo = resposta. Feição = algo que sabemos sobre o exemplo

Desfrute de mais traduções de ciência de dados em português aqui.

--

--

Cassie Kozyrkov
Cassie Kozyrkov

Written by Cassie Kozyrkov

Head of Decision Intelligence, Google. Hello (multilingual) world! This account is for translated versions of my English language articles. twitter.com/quaesita

No responses yet