JHU MOOC EDA W1

JHU Data Science Specialization logoContinuando con el track de  especialización en ciencia de datos esta semana inicié el cuarto curso de nombre Exploratory Data Analysis. Mientras iniciaba con las video lecturas me preguntaba dónde ando en este instante, por lo que un recuento de estos cursos ha sido necesario.

El primer curso, The Data Scientist’s Toolbox, fue destinado a familiarizarse con algunas de las herramientas estándar que actualmente muchos investigadores usan para trabajar con datos y compartir resultados. El segundo curso, R Programming, presenta los aspectos generales de uso del lenguaje de propósito específico R (tipos de datos, objetos, escritura y lectura de datos, estructuras de control, funciones, alcance semántico de variables, depuración y perfilamiento). El tercer curso, Getting and Cleaning Data, está enfocado a la obtención de datos y su preparación para su procesamiento.

Así, el cuarto curso está dedicado a, una vez teniendo ya conocimiento de herramientas y cómo preparar los datos para su procesamiento, pasamos a la revisión de algunas técnicas e ideas de cómo realizar una rápida exploración de los datos para su análisis o previo a éste.

JHU Exploratory Data Analysis course

En esta primera semana, dentro de los temas revisados, Roger D. Peng presentó algunos principios sobre la presentación de datos en gráficas y la información que deben transmitir:

  1. Mostrar comparaciones
  2. Mostrar causalidad, mecanismos, explicaciones y estructura sistemática.
  3. Mostrar datos multivariables.
  4. Integración de evidencia.
  5. Descripción y documentación mediante la adecuada etiquetación.
  6. La importancia del contenido.

La mayor parte de las video lecturas estuvieron dedicadas a los aspectos de R para crear gráficas exploratorias y analíticas. Así, se revisó:  los sistemas de graficación en R:

  1. El sistema base, en el que cada aspecto de la gráfica se hace separadamente en una serie de llamados a funciones.
  2. El sistema de capas (lattice), todos los aspectos de la gráfica son especificados y usados en una sola invocación.
  3. El sistema ggplot2, combina los dos anteriores en una implementación independiente.
  4. El proceso de manufactura de una gráfica.

Y concluyeron revisando los dispositivos de graficación disponibles:

  • Pantalla.
  • Archivos.

 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s