UIUC MOOC CADM W2

Cluster Analysis in Data Mining logoEstoy en la segunda semana del curso de Cluster Analysis in Data Mining. El curso es enteramente teórico y Jiawei Han habla demasiado leeeennnnttttooo. Está pesado el curso. Imposible que a uno  no le gane el sueño… más cuando uno toma estos cursos por la noche. Debo cambiar mi esquema de trabajo y tratar de tomar esta video lecturas en un horario en el que esté mucho más despierto.

La primera parte de las lecturas de esta semana están dedicadas a revisar el concepto del agrupamiento jerárquico (hierarchical clustering) y sus algoritmos, lo que comprendió:

  • Algoritmos aglomerativos
  • Algoritmos de separación (divisive)
  • Extensiones al concepto de agrupamiento jerárquico
  • El Algoritmo BIRCH.
  • El algoritmo CURE
  • El algoritmo CHAMALEON
  • Agrupamiento jerárquico probabilístico

La segunda parte  estuvo dedicada a métodos basados en densidad y en malla (grid), que en esencia es tomar valores de proximidad y localidad como elementos de decisión de agrupammiento

La tercera parte de las video lecturas se dedicó a los modelos probabilísticos, esencialmente basado en procesos generativos, como lo es la típica distribución gaussiana:

Gaussian distribution

 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s