De “encodings” y “locales”

GibberishEsto de los conjunto de caracteres y esquemas de codificación es un circo… y se supone que las cosas están ya lo suficientemente avanzadas como para que estas cosas ya no fueran tanto problema pero así lo es todavía. De cuando en cuando, al pasar un archivo de una plataforma a otra, es decir, al abrir un archivo inicialmente trabajado en un Unix en Windows (o viceversa) uno se topa con la desagradable imagen de lo que parece ser “gibberish“.

Estando en Unix, la primera reacción es revisar el “encoding” de la terminal con el comando locale para encontrarse el típico valor por defecto en_US_POSIX.US-ASCII, también conocido como  “C locale” pero a veces se nos puede pasar que simplemente se trata de que los parámetros de la terminal no empatan con la configuración de la sesión.

Terminal.app's encoding settings

El byte order mark (BOM) es un caracter unicode que puede aparecer al inicio de un archivo o flujo de caracteres a manera de “número mágico“. Este valor proporciona a la mayoría de las aplicaciones información suficiente para presentar adecuadamente los caracteres en pantalla, lo que es una variable adicional a considerar, ya que se nos puede olvidar lo ya mencionado sobre la configuración de la sesión y de la terminal.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s