Statistics Toolbox

Regresión y ANOVA

Regresión

Con la regresión, puede modelar una variable de respuesta continua en forma de función de uno o más predictores. Statistics Toolbox ofrece una amplia gama de algoritmos de regresión, lo que incluye regresión lineal, modelos lineales generalizados, regresión no lineal y modelos de efectos mixtos.

Regresión lineal

La regresión lineal es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua a modo de función de una o varias variables predictivas. Puede ayudarle a comprender y predecir el comportamiento de sistemas complejos o a analizar datos experimentales, financieros y biológicos.

Esta toolbox ofrece varios tipos de modelos de regresión lineal y métodos de ajuste , entre los que se cuentan:

  • Simple: un modelo con un único predictor
  • Múltiple: un modelo con varios predictores
  • Multivariante: un modelo con varias variables de respuesta
  • Robusto: un modelo con valores atípicos
  • Por pasos: un modelo con selección automática de variables
  • Regularizado: un modelo que admite predictores redundantes y evita el sobreajuste mediante algoritmos de ridge, lasso y de red elástica

Estadística computacional: selección de características, regularización y reducción con MATLAB 36:51
Averigüe cómo generar ajustes precisos en presencia de datos correlacionados.

Regresión no lineal

La regresión no lineal es una técnica de modelado estadístico que contribuye a describir relaciones no lineales en datos experimentales. Se suele considerar que los modelos de regresión no lineal son paramétricos, donde el modelo se describe en forma de ecuación no lineal. Normalmente se emplean métodos de aprendizaje automático para la regresión no lineal y no paramétrica.

Esta toolbox también ofrece ajuste no lineal robusto para hacer frente a los valores atípicos en los datos.

Ajustar con MATLAB: estadística, optimización y ajuste de curvas 38:37
Aplicar algoritmos de regresión con MATLAB.

Modelos lineales generalizados

Los modelos lineales generalizados son un caso especial de modelos no lineales que emplean métodos lineales. Permiten que las variables de respuesta tengan distribuciones nonormales y una función de enlace que describe cómo se relaciona el valor esperado de la respuesta con los predictores lineales.

Statistics Toolbox soporta el ajuste de modelos lineales generalizados con las siguientes distribuciones de respuesta:

  • Normal (regresión probit)
  • Binomial (regresión logística)
  • Poisson
  • Gamma
  • Gaussiana inversa

Ajuste de datos con modelos lineales generalizados (Ejemplo)
Cómo ajustar y evaluar modelos lineales generalizados mediante glmfit y glmval.

Modelos de efectos mixtos

Los modelos de efectos mixtos lineales y no lineales son generalizaciones de modelos lineales y no lineales para datos recopilados y resumidos en grupos. Estos modelos describen la relación entre una variable de respuesta y las variables independientes, con coeficientes que pueden variar con respecto a una o varias variables de agrupación.

Statistics Toolbox soporta el ajuste de modelos multinivel o jerárquicos con efectos aleatorios anidados y/o cruzados que se pueden utilizar para realizar diversos estudios, entre los que se cuentan:

  • Análisis longitudinal/análisis de paneles
  • Modelado de medidas repetidas
  • Modelado del crecimiento
Plot comparing Gross State Product for three states fitted using a multilevel mixed-effects model and ordinary least-squares.
ráfico donde se compara el producto interior bruto de tres países ajustado mediante un modelo de efectos mixtos multinivel (izquierda) y de mínimos cuadrados ordinarios (derecha). La función fitlme de Statistics Toolbox puede crear modelos con mayor precisión de predicción cuando los datos se recopilan y resumen en grupos.

Evaluación de modelos

Statistics Toolbox permite evaluar modelos para algoritmos de regresión mediante pruebas de significación estadística y medidas de bondad de ajuste, tales como:

  • Estadístico F y estadístico T.
  • R2 y R2 ajustado.
  • Error cuadrático medio con validación cruzada.
  • Criterio de información de Akaike (AIC) y criterio de información bayesiano (BIC).

Es posible calcular los intervalos de confianza tanto para coeficientes de regresión como para valores predichos.

Regresión no paramétrica

Statistics Toolbox también soporta técnicas de regresión no paramétrica para la generación de un ajuste preciso sin especificar un modelo que describa la relación entre el predictor y la respuesta. Las técnicas de regresión no paramétrica se pueden clasificar en líneas generales bajo el aprendizaje automático supervisado para la regresión, e incluyen tanto árboles de decisión como árboles de regresión boosted y bagged.

Ajuste no paramétrico 4:07
Desarrolle un modelo predictivo cuando no pueda especificar una función que describa la relación entre variables.

ANOVA

El análisis de la varianza (ANOVA) le permite asignar una varianza de muestra a distintas fuentes y determinar si la variación surge dentro o entre distintos grupos de población. Statistics Toolbox incluye los siguientes algoritmos ANOVA y técnicas relacionadas:

  • Onw-way ANOVA (un factor)
  • Two-way ANOVA (dos factores) para datos balanceados
  • Multiway ANOVA (múltiples factores) para datos balanceados y no balanceados
  • ANOVA multivariante (MANOVA)
  • One-way y Two-way ANOVA no paramétrico (Kruskal-Wallis y Friedman)
  • Análisis de la covarianza (ANOCOVA)
  • Análisis de varianza con medidas repetidas (RANOVA)
  • Comparación múltiple de medias, pendientes e intersecciones de grupos
Siguiente: Aprendizaje automático

Probar Statistics Toolbox

Obtener software de prueba

MATLAB para usuarios de Excel

Ver seminario virtual