Statistics Toolbox

Estadística multivariante

La estadística multivariante proporciona algoritmos y funciones para analizar múltiples variables. Las aplicaciones más habituales son:

  • Transformar datos correlacionados en un conjunto de componentes no correlacionados por medio de rotación y centrado (análisis de los componentes principales).
  • Explorar las relaciones entre variables mediante técnicas de visualización, tales como matrices de gráficos de dispersión y escalado multidimensional clásico.
  • Segmentación de datos con análisis de conglomerados.
Ejemplo: Ajustar una regresión ortogonal mediante el análisis de los componentes principales

Ajustar una regresión ortogonal mediante el análisis de los componentes principales (ejemplo)
Implementar regresión Deming (total de mínimos cuadrados).

Transformación de características

Las técnicas de transformación de características permiten la reducción de la dimensionalidad cuando las características transformadas pueden ser ordenadas más fácilmente que las características originales. Statistics Toolbox ofrece tres clases de algoritmos de transformación de características:

  • Análisis de los componentes principales para resumir los datos en menos dimensiones.
  • Factorización de matrices no negativas cuando los términos del modelo deben representar cantidades no negativas.
  • Análisis factorial para crear modelos explicativos de correlación de datos.
Ejemplo: Regresión de mínimos cuadrados parciales y regresión de componentes principales.

Regresión de mínimos cuadrados parciales y regresión de componentes principales (ejemplo)
Modelar una variable de respuesta en presencia de predictores altamente correlacionados.

Visualización multivariante

Statistics Toolbox proporciona gráficos y diagramas para explorar visualmente los datos multivariante, tales como:

  • Matrices de gráficos de dispersión.
  • Dendogramas.
  • Biplots.
  • Diagramas de coordenadas paralelas.
  • Gráficos de Andrews.
  • Gráficos de glifos.
Matriz de gráfico de dispersión de grupo que muestra cómo influye el año del modelo en distintas variables.

Matriz de gráfico de dispersión de grupo que muestra cómo influye el año del modelo en distintas variables.

Biplot que muestra las tres primeras cargas de un análisis de los componentes principales.

Biplot que muestra las tres primeras cargas de un análisis de los componentes principales.

Gráfico de Andrews que muestra cómo influye el país de origen en las variables.

Gráfico de Andrews que muestra cómo influye el país de origen en las variables.

Análisis de conglomerados

Statistics Toolbox ofrece diversos algoritmos para el análisis de conglomerados, como:

  • Agrupación jerárquica, que crea una agrupación aglomerativa que normalmente se representa en forma de árbol.
  • Agrupación de k-medias, que asigna puntos de datos a la agrupación con la media más cercana.
  • Mezclas gaussianas, que se forman combinando componentes de densidad normal multivariante. Las agrupaciones se asignan seleccionando el componente que maximiza la probabilidad posterior.
Modelo de mezcla gaussiana de dos componentes ajustado a una mezcla de gaussianas bivariantes.

Modelo de mezcla gaussiana de dos componentes ajustado en una mezcla de bivariantes gaussianas.

Resultado de aplicar un algoritmo de agrupación al mismo ejemplo.

Resultado de aplicar un algoritmo de agrupación al mismo ejemplo.

Gráfico de dendograma que muestra un modelo con cuatro agrupaciones.

Gráfico de dendograma que muestra un modelo con cuatro agrupaciones.

Siguiente: Distribuciones de probabilidad

Probar Statistics Toolbox

Obtener software de prueba

Multilevel Mixed-Effects Modeling Using MATLAB

Ver seminario virtual