Seu projeto de IA é inviável?
Aqui temos um check list realista para ajudar a evitar a dor de aprender da forma difícil
Traduzido por Thomas Chi do original de Cassie Kozyrkov
Se você está para mergulhar em um projeto de aprendizado de máquina our IA, aqui temos um check list para você conferir antes de mergulhar em algoritmos, dados e engenharia. Pense nisso como seu consultor amigável.
Não desperdice seu tempo em IA pela necessidade de IA. Seja motivado por aquilo que será feito para você, não por como a ficção científica soa.
Esta é uma versão super sucinta sobre o meu guia monstruoso para começar com IA. Se você está para embarcar em AM/IA, aqui esperamos que você possa marcar “sim” para todas estas questões.
Passo 1 de AM/IA de 22 partes: Outputs, objetivos e viabilidade
- Delegação correta: A pessoa liderando o projeto e o check list entendem de fato o seu negócio? Delegue a tomada de decisão para uma pessoa que entenda o negócio, não para o nerd dos algoritmos que faz de tudo.
- Output-focado na concepção de ideias: Você consegue explicar quais os outputs do sistema serão e por que vale tê-los? Foque primeiro naquilo que você está fazendo, não como você faz; não confunda os fins com os meios.
- Fonte de inspiração: Você considerou ao menos a mineração de dados como uma abordagem para obter inspiração sobre usos potenciais? Embora não seja obrigatório, isso pode ajudar a encontrar uma boa direção.
- Tarefas apropriadas para AM/IA: Você está automatizando decisões/etiquetas? Onde você não pode apenas encontrar a resposta perfeitamente cada vez? Responder “não” é um sinal bastante alto de que AM/IA não é para você.
- Perspectiva UX: Você pode articular quem são seus usuários? Como eles utilizarão seus outputs? Você sofrerá com um design de má qualidade se você não pensar sobre seus usuários antes.
- Desenvolvimento ético: Você pensou sobre todos os humanos impactados pela sua criação? Este é especialmente importante para todas as tecnologias com potencial de serem escaladas rapidamente.
- Expectativas razoáveis: Você entende que seu sistema pode ser excelente, mas não será infalível? Você pode viver com erros ocasionais? Você já pensou sobre o que isso significa do ponto de vista ético?
- Possível em produção: Independente da origem daquelas decisões/etiquetas, você conseguirá colocá-las em produção? Você pode reunir recursos de engenharia para fazer na escala que você prevê?
- Dados para aprender: Existem inputs potencialmente úteis? Você consegue obter acesso a eles? (É ok se os dados não existem ainda desde que você tenha um plano de obtê-los logo.)
- Exemplos suficientes: Você perguntou para um estatístico ou engenheiro de aprendizado de máquina se o montante de dados que você tem são suficientes para aprender? Suficiente não é medido em bytes, logo pegue um café com alguém cuja intuição é bem treinada e faça a verificação.
- Computadores:Você tem acesso a recursos suficientes de processamento para lidar com o volume dos seus dados? (Tecnologias cloud fazem isso automaticamente para qualquer pessoa aberta a considerar usá-las)
- Time: Você tem confiança de que pode montar um time com as habilidades necessárias?
- Evidências empíricas: A não ser que você esteja procurando aprendizado não supervisionado, você tem acesso aos outputs?Caso contrário, você pode pagar humanos para fazer isso para você através da execução de tarefas repetidamente?
- Registrando sanidade: É possível dizer qual input vai com qual output, certo?
- Registrando qualidade: Você confia que os dados são exatamente aquilo que os fornecedores clamam? (Para aprender de exemplos, você precisa de bons exemplos para aprender deles.)
- Curvas de indiferença: Já que seu sistema cometerá erros, você considerou quão pior um tipo de erro é em relação a outro?
- Simulação: Você considerou trabalhar com um expert em simulação para ajudar a visualizar o que você está pedindo? Não é obrigatório, mas útil.
- Criação de métricas: Você construiu a pontuação de outputs individuais em uma métrica para a performance do negócio em seu sistema em muitas instâncias?
- Revisão das métricas: Você revisou as métricas de performance do negócio para garantir que não é possível obter uma nota boa de forma perversa ou danosa?
- Comparação na perda de métricas: (Opcional.) As métricas de performance de negócios correlacionam bem com a função de perda padrão? Senão, o que você está pedindo pode ser muito difícil.
- População: Você pensou cuidadosamente sobre quais instâncias você precisa para que o seu sistema funcione? A população estatística de interesse define quão ampla é a coleção de instâncias que será coberta nos testes de performance do seu sistema.
- Performance mínima: Você já definiu o critério de performance mínimo de forma estrita para testar e está comprometido a quebrar seu sistema se não atingir esse patamar?
Uma vez que você respondeu “sim” para tudo, você está pronto para mover para o próximo passo de AM/IA, que envolve dados e hardware (e engenheiros, oba!). Eu colocarei um guia em breve.
Se isso foi muito curto para um resumo, o guia completo para começar projetos de IA está aqui. Aproveite!
Aprenda mais sobre ciência de dados e inteligência artificial em português.