JHU MOOC EDA W3 (3)

JHU Exploratory Data Analysis courseEn lo que respecta al tema de la reducción de dimensiones o de “dimensionalidad” se recurre al Principal Component Analysis (PCA) y Singular Value Descomposition (SVD), muy similares ambos.

PCA es una técnica utilizada para reducir la dimensionalidad de un conjunto de datos. Intuitivamente la técnica sirve para hallar las causas de la variabilidad de un conjunto de datos y ordenarlas por importancia. Matemáticamente se define como una transformación lineal ortogonal que transforma los datos a un nuevo sistema de coordenadas de manera que la mayor varianza pr alguna proyección de los datos resida en la  primer coordenada (el componente principal), la segunda mayor variación en la segunda coordenada y así sucesivamente.

SVD por su parte, es la factorización matricial de la transformación de los componentes principales.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s