https://www.facebook.com/cienciasinseso/

Estadística

El cocinero mentiroso

La distribución binomial se utiliza cuando queremos calcular la probabilidad de obtener un cierto número de éxitos en una serie de ensayos de Bernoulli, conociendo de antemano la probabilidad de éxito en cada uno. En cambio, la distribución beta se usa cuando ocurre lo contrario: ya hemos observado un número determinado de éxitos y fracasos, y queremos estimar cuán probable es cada posible valor de la probabilidad de éxito. Es decir, nos permite actualizar nuestras creencias sobre esa probabilidad tras haber recogido datos.

Continuar leyendo

01/07/2025
2 comentarios

Aprendizaje automático / Estadística

La simpatía de los péndulos

Se discute la razón para justificar la minimización de la suma de los errores cuadráticos en regresión lineal, que se suele presentar como una simple elección conveniente. Una perspectiva probabilística sugiere que la ecuación de mínimos cuadrados surge naturalmente de asumir que los residuos del modelo siguen una distribución normal.

Continuar leyendo

10/06/2025

Estadística

Las tribulaciones de un astronauta

La regresión logística binaria emplea la función sigmoide para estimar la probabilidad de la variable objetivo cuando esta es binaria. Sin embargo, esta función no permite estimaciones directas de probabilidad cuando tratamos con variables nominales con más de dos categorías. En estos casos, emplearemos la regresión logística multinomial, que empleará la función softmax para estimar las probabilidades respecto a una categoría de referencia.

Continuar leyendo

20/05/2025

Estadística

El misterio del crimen imperfecto

La tau-cuadrado representa la variabilidad de efectos entre las distintas poblaciones de las que proceden los estudios primarios de una revisión sistemática, según la suposición del modelo de efectos aleatorios del metanálisis. Se describe su utilidad para la ponderación de estudios y para el cálculo de intervalos de predicción, comprendiendo cómo su significado va más allá de ser un mero indicador de heterogeneidad.

Continuar leyendo

29/04/2025

Estadística

Entre asociaciones y coincidencias

La V de Cramer permite cuantificar la fuerza de la asociación entre dos variables categóricas (nominales), no ordinales. Es especialmente útil cuando las variables tienen múltiples categorías, ya que permiten condensar la fuerza de asociación en una sola cifra. Sus valores abarcan desde 0, no asociación, hasta 1, una asociación perfecta.

Continuar leyendo

08/04/2025