En lo que respecta al tema de la reducción de dimensiones o de «dimensionalidad» se recurre al Principal Component Analysis (PCA) y Singular Value Descomposition (SVD), muy similares ambos.
PCA es una técnica utilizada para reducir la dimensionalidad de un conjunto de datos. Intuitivamente la técnica sirve para hallar las causas de la variabilidad de un conjunto de datos y ordenarlas por importancia. Matemáticamente se define como una transformación lineal ortogonal que transforma los datos a un nuevo sistema de coordenadas de manera que la mayor varianza pr alguna proyección de los datos resida en la primer coordenada (el componente principal), la segunda mayor variación en la segunda coordenada y así sucesivamente.
SVD por su parte, es la factorización matricial de la transformación de los componentes principales.