Stanford MOOC MMD W1

mmds_logoLa tercer semana de septiembre también inicié un MOOC con título Mining Massive Datasets (minando conjuntos de datos masivos), que co-imparte Jeffrey Ullman también (aunque en la primera semana de video lecturas no aparece en ninguna de éstas). Este curso es más científico, en comparación con el de cloud computing (que es más tecnológico) aunque al final ambos MOOC están más o menos orientados a lo mismo.

Las primeras video lecturas (40%) estuvieron dedicadas a dar una descripción del modelo computacional que soporta la idea del MapReduce. El resto se dedicó de lleno a explicar cómo es que funciona el algoritmo PageRank.

MapReduce es un procedimiento con el que es capaz de segmentar un conjunto de datos para trabajar en forma paralela (o al menos concurrente) sobre los segmentos (el “mapeo”), produciendo resultados intermedios que serán la entrada de posteriores procesos “reductores” y entregando al final un resultados en un tiempo mucho más breve que el que pudo haber tomado al hacerlo de forma tradicional.

MapReduce

Por su parte, PageRank es el algoritmo que dio inicio a Google. Éste responde a la necesidad de categorizar por un índice de importancia a hipertextos por los enlaces que a cada uno llega y pudieran tener a otros documentos.

LinksAunque pudiera parecer algo simplemente “talachudo”, algo de contar entradas y salidas, lo cierto es que no es tarea fácil. La calificación (score) de cada página depende recursivamente de las páginas que apuntan a ésta:

PageRank

y así la implementación del algoritmo ofrece varios retos.

PageRank

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s