A ideia mais importante em estatística

Cassie Kozyrkov
4 min readApr 11, 2019

--

Traduzido por Victor Tseimazides do original de Cassie Kozyrkov

O que vem à mente quando você pensa na disciplina de estatística?

Populações, amostras, hipóteses? Ou talvez você tenha feito um curso que enfatizou probabilidades, distribuições, valor-p, e intervalos de confiança? Todas estas são peças do quebra-cabeças, mas elas estão longe do principal. O real início de tudo — o trampolim para a confusão — é a ação padrão.

O que é a ação padrão?

Estatística é a ciência de mudar de ideia sob incerteza, então a primeira coisa a fazer é descobrir o que você vai fazer a menos que os dados te convençam do contrário. É por isso que tudo começa com a ação/decisão física com que você se compromete a fazer caso você não colete nenhuma (outra) evidência. Isto é chamado de sua ação padrão.

Este artigo é parte de uma série:

  • Parte 1 traz os conceitos à vida com um exemplo.
  • Parte 2 (bem-vindo(a)!) revisita o exemplo para te mostrar o que muda se você definir uma ação padrão diferente na Parte 1. (Spoiler: Tudo muda!)

Universo paralelo: A outra ação padrão

Você acaba de aterrissar em um planeta alienígena. Sua missão? Descobrir se há vida alienígena aqui. A pegadinha? Seu orçamento insignificante só permite que você procure por três horas antes de vocês selecionar uma resposta (SIM ou NÃO) e seguir em frente para uma próxima missão.

Isto é tudo o que há no seu painel de controle. SIM, há vida alienígena aqui. NÃO, não há vida alienígena aqui. Não há maneiras de incluir um “talvez”, comentários ou limites.

No artigo anterior, seus chefes tinham escolhido o botão NÃO (NÃO há alienígenas) como a ação padrão deles. O que teria acontecido se, ao invés disso, eles tivessem escolhido o botão SIM? Eis a configuração:

Ação padrão: Apertar o botão SIM.

Ação alternativa: Apertar o botão NÃO.

Hipótese nula (H0): Há vida alienígena neste planeta.

Hipótese alternativa (H1): Não há vida alienígena neste planeta

Se lembra da grande questão no coração da estatística? Na Parte 1 nós vimos que todas as inferências estatísticas se resumem a uma única frase:

“A evidência que coletamos faz com que nossa hipótese nula pareça ridícula?”

Isto significa que estamos perguntando se o que vemos na nossa caminhada de três horas faz com que a frase “Há vida alienígena neste planeta” pareça ridícula. Antes que a gente saia por aí visitando outro planeta, vamos pensar sobre o que podemos ver.

Suponha que vimos alienígenas. A nossa hipótese nula é ridícula? Não, claro que não. E se caminhássemos por três horas e não tivéssemos visto nenhum alienígena? A hipótese nula da vida alienígena é ridícula? Ainda não. (Se você está tendo dificuldades com isso, você realmente deveria ir caminhar no planeta Terra um dia. É fácil passar três horas sem ver nenhum outro ser humano…)

Qual o ponto? De qualquer maneira, nós vamos responder à nossa pergunta com um “não”.

Isto significa que nós vamos tomar a ação padrão (botão SIM) sempre, não importa qual a evidência. O único modo de apertarmos NÃO nesta configuração seria se pudéssemos procurar em cada canto do planeta para confirmar que está livre de alienígenas, o que é muito para nosso orçamento escasso.

Exploração espacial trabalhando de casa? Melhor trabalho do mundo!

Você já consegue ver motivo para comemorar? Se os políticos da sua empresa de exploração espacial escolhem o botão SIM como o correto para apertar quando há informação nova… você pode fazer exploração espacial trabalhando de casa, descansando em seu pijama enquanto aperta SIM, SIM, SIM, SIM, SIM para todos os planetas!

Além disso, ficar no seu sofá é a coisa certa a se fazer. Ir ao planeta apenas para poder fazer uns cálculos complicados é uma perda de tempo e de combustível. Os tomadores de decisão escolheram este framework de decisão e, nele, apertar SIM é a resposta correta. Não lamente e tente ir para outra ação padrão para ter uma desculpa para usar uma fórmula bonita — isto não é a faculdade. Nós não calculamos as coisas apenas para calcular coisas. Nós fazemos cálculos estatísticos para ver o que os dados têm a nos dizer sobre mudar as ações. (Adivinhe: às vezes nós podemos ver a resposta, então não precisamos nem calcular nada.)

Se você não gosta de como seus líderes escolheram a ação padrão e o contexto de decisão, é melhor você aplicar para o cargo deles, então você pode tomar essas decisões um dia. Enquanto você é um mero cientista de dados (ou astronauta), seu trabalho é fazer o certo no contexto que seus líderes criaram para você.

As habilidades de seus tomadores de decisão ajudam ou atrapalham todo o seu esforço. Escolha-os sabiamente.

Sua ação padrão determina a análise inteira. Por favor, não tente começar da hipótese e trabalhar de frente para trás até a ação padrão que te permite usar a matemática que você gosta. Se você não tem uma ação padrão, você nem precisa de inferência estatística. Ao invés, leia isto.

Aprenda mais sobre ciência de dados e inteligência artificial em português.

--

--

Cassie Kozyrkov
Cassie Kozyrkov

Written by Cassie Kozyrkov

Head of Decision Intelligence, Google. Hello (multilingual) world! This account is for translated versions of my English language articles. twitter.com/quaesita

No responses yet