La idea más importante en Estadística

Cassie Kozyrkov
5 min readApr 1, 2020

--

Traducido por Ale Koretzky del original por Cassie Kozyrkov. (Editado por Carlos Secada)

¿Qué se te viene a la mente cuando piensas sobre la disciplina de la Estadística?

¿Poblaciones, muestras e hipótesis? ¿O quizás tomaste un curso con énfasis en probabilidades, distribuciones, valores-p e intervalos de confianza? Todas estas piezas pertenecen al rompecabezas, pero vienen luego de lo más elemental. El verdadero comienzo, lo que le da origen a todo esto, es la acción por defecto.

¿Qué es una acción por defecto?

La Estadística es la ciencia de cambiar tu opinión frente a la incertidumbre, así que el primer paso es descubrir qué vamos a hacer a menos que los datos nos contradigan. Es por eso que todo comienza con una acción o decisión que te comprometes a llevar a cabo si no recolectas ninguna evidencia. A esto lo llamamos acción por defecto.

Este artículo es parte de una serie:

  • Parte 0 introduce los conceptos.
  • Parte 1 ilustra los conceptos con un ejemplo.
  • Parte 2 (¡bienvenido!) revisa el ejemplo de la parte 1 para mostrarte lo que cambia cuando eliges una acción por defecto diferente. (pista: ¡todo cambia!)

Universo paralelo: la otra acción por defecto

Acabas de aterrizar en otro planeta. ¿Tu misión? Averiguar si existe vida extraterrestre. ¿La trampa? Tu pobre presupuesto solo te permite buscar durante 3 horas antes de seleccionar una respuesta (SI o NO) y continuar con tu próxima tarea.

Este es todo tu panel de control. “SI”, significa que existe vida extraterrestre en el lugar y “NO”, que no existe vida en el lugar. No hay manera de decir “quizás” o de agregar comentarios.

En el artículo anterior, tus jefes habían establecido NO (no hay extraterrestres) como acción por defecto. ¿Qué hubiera pasado si hubiesen elegido el botón SI en lugar de NO? Este sería el nuevo esquema:

Acción por defecto: Presionar el boton SI.

Accion alternativa: Presionar el boton NO.

Hipotesis nula (H0): Existe la vida extraterrestre en este planeta.

Hipotesis alternativa (H1): No existe la vida extraterrestre en este planeta.

¿Recuerdas la gran pregunta de la Estadística? En la parte 1 vimos que toda la inferencia estadística se reduce a una sola poderosa frase:

“¿La evidencia que hemos recolectado, deja en ridículo a nuestra hipótesis nula?”

Esto significa que estamos preguntando si lo que vimos en nuestra caminata de 3 horas hace que la frase “Existe vida extraterrestre en este planeta” parezca ridícula. Antes de que nos pongamos nuestro traje y volemos al planeta, pensemos por un segundo lo que podríamos llegar a ver.

Supongamos que vemos un extraterrestre. ¿Queda en ridículo nuestra hipótesis nula? No, por supuesto que no. ¿Que pasa si caminamos durante 3 horas y no vemos ningún extraterrestre? Nuestra hipótesis nula sobre vida extraterrestre, ¿queda en ridículo? Aún no. (si esto te está complicando, deberías ir a caminar al planeta tierra. Es fácil caminar durante 3 horas sin ver a ningún humano..)

¿El remate? De cualquier forma, responderemos a nuestra pregunta de prueba con un “no”.

Eso significa que tomaremos nuestra acción por defecto (botón SI) cada vez, sin importar lo que la evidencia diga. La única forma que podríamos presionar NO en este esquema es si buscáramos detrás de todas y cada una de las rocas del planeta para confirmar que no hay un solo extraterrestre, lo cual es demasiado para nuestro limitado presupuesto.

Exploración espacial desde la casa? El trabajo de tus sueños

¿Te das cuenta del motivo de celebración? Si las políticas de la compañía de exploración espacial eligen el botón SI como el correcto al obtener nueva información… puedes hacer exploración espacial desde tu casa, ¡relajándote en tus pijamas mientras presionas el botón SI, SI, SI, SI, SI para todos los planetas!

Es más, quedarte en tu sillón es lo correcto. Ir hasta el planeta simplemente para hacer unos cálculos complicados es una pérdida de tiempo y combustible. Los decision-makers (quienes toman las decisiones) han elegido este proceso de toma de decisiones y dentro de él, presionar SI es la acción correcta. No llores y trates de ir con la otra acción por defecto para tener una excusa para usar una fórmula sofisticada — esto no es la universidad. No calculamos cosas solo por el hecho de calcular cosas. Solo hacemos cálculos estadísticos para ver qué dicen los datos acerca de intercambiar las acciones. (adivina que, a veces podemos ver la respuesta, así que ni siquiera necesitamos hacer cálculos.)

Si no te gusta como tus líderes escogieron la acción por defecto y el contexto de decisión, deberías aplicar a sus trabajos para que algun dia seas tu quien toma las decisiones. Mientras seas un simple Científico de Datos (o astronauta), tu trabajo es alinearte a los contextos que tus líderes han creado para ti.

Las aptitudes de tus decision-makers arreglan o destruyen todos los proyectos de estadística. Escógelos sabiamente.

Tu acción por defecto determina el análisis completo. Por favor, no intentes empezar por la hipótesis y en lugar, trabaja de forma inversa hacia la acción por defecto que te permita usar los cálculos que tu prefieras. Si no tienes una acción por defecto preferida, ni siquiera necesitas inferencia estadística. Lee esto en su lugar.

Obtén más información sobre ciencia de datos e inteligencia artificial en español aquí.

--

--

Cassie Kozyrkov
Cassie Kozyrkov

Written by Cassie Kozyrkov

Head of Decision Intelligence, Google. Hello (multilingual) world! This account is for translated versions of my English language articles. twitter.com/quaesita

No responses yet