JHU MOOC EDA W3 (3)

JHU Exploratory Data Analysis courseEn lo que respecta al tema de la reducción de dimensiones o de «dimensionalidad» se recurre al Principal Component Analysis (PCA) y Singular Value Descomposition (SVD), muy similares ambos.

PCA es una técnica utilizada para reducir la dimensionalidad de un conjunto de datos. Intuitivamente la técnica sirve para hallar las causas de la variabilidad de un conjunto de datos y ordenarlas por importancia. Matemáticamente se define como una transformación lineal ortogonal que transforma los datos a un nuevo sistema de coordenadas de manera que la mayor varianza pr alguna proyección de los datos resida en la  primer coordenada (el componente principal), la segunda mayor variación en la segunda coordenada y así sucesivamente.

SVD por su parte, es la factorización matricial de la transformación de los componentes principales.

Deja un comentario

Este sitio utiliza Akismet para reducir el spam. Conoce cómo se procesan los datos de tus comentarios.