Statistics Toolbox

Estadística multivariante

La estadística multivariante proporciona algoritmos y funciones para analizar múltiples variables. Entre las aplicaciones habituales se cuentan la reducción de la dimensionalidad por medio de la transformación y la selección de características y la exploración de relaciones entre variables mediante técnicas de visualización, tales como matrices de gráficos de dispersión y escalado multidimensional clásico.

Ejemplo: Ajustar una regresión ortogonal mediante el análisis de los componentes principales

Ajuste de una regresión ortogonal mediante el análisis de componentes principales (Ejemplo)
Implementación de la regresión de Deming (total de mínimos cuadrados).

Transformación de características

La transformación de características (a veces denominada “extracción de características”) es una técnica de reducción de la dimensionalidad que transforma características existentes en otras nuevas (variables predictivas) cuando & características menos descriptivas se pueden eliminar. Esta toolbox ofrece los siguientes enfoques para la transformación de características:

Ejemplo: Regresión de mínimos cuadrados parciales y regresión de componentes principales.

Regresión de mínimos cuadrados parciales y regresión de componentes principales (Ejemplo)
Modelo de una variable de respuesta en presencia de predictores altamente correlacionados.

Selección de características

La selección de características es una técnica de reducción de la dimensionalidad que selecciona únicamente el subconjunto de características medidas (variables predictivas) que proporciona el máximo poder predictivo en el modelado de los datos. Resulta útil cuando se trata de datos altamente dimensionales o si el coste de recopilar datos para todas las características es prohibitivo.

Entre los métodos de selección de características se cuentan los siguientes:

  • La regresión por pasos agrega o elimina secuencialmente características hasta que no existe mejora en la precisión de la predicción; se puede emplear con algoritmos de regresión lineal o regresión lineal generalizada.
  • La selección secuencial de características es similar a la regresión por pasos y se puede emplear con cualquier algoritmo de aprendizaje supervisado y una medida de rendimiento personalizada.
  • La regularización (lasso y redes elásticas) emplea estimadores shrinkage para eliminar características redundantes al disminuir sus pesos (coeficientes) a cero.

La selección de características se puede emplear para:

  • mejorar la precisión de un algoritmo de aprendizaje automático;
  • impulsar el rendimiento sobre datos altamente dimensionales;
  • mejorar la interpretabilidad del modelo;
  • evitar el sobreajuste.
Selección de características para clasificar datos altamente dimensionales

Selección de características para clasificar datos altamente dimensionales (Ejemplo)
Selección de características importantes para la detección del cáncer.

Visualización multivariante

Statistics Toolbox proporciona gráficos y diagramas para explorar visualmente los datos multivariante, tales como:

  • Matrices de gráficos de dispersión.
  • Dendogramas.
  • Biplots.
  • Diagramas de coordenadas paralelas.
  • Gráficos de Andrews.
  • Gráficos de glifos.
Matriz de gráfico de dispersión de grupo que muestra cómo influye el año del modelo en distintas variables.
Matriz de gráfico de dispersión de grupo que muestra cómo influye el año del modelo en distintas variables.
Biplot que muestra las tres primeras cargas de un análisis de los componentes principales.
Biplot que muestra las tres primeras cargas de un análisis de los componentes principales.
Gráfico de Andrews que muestra cómo influye el país de origen en las variables.
Gráfico de Andrews que muestra cómo influye el país de origen en las variables.
Siguiente: Distribuciones de probabilidad

Probar Statistics Toolbox

Obtener software de prueba

MATLAB para usuarios de Excel

Ver seminario virtual