Cómo escribir caracteres Unicode | Tres Tristes Tigres

miércoles, 8 de diciembre de 2010

Cómo escribir caracteres Unicode

No voy a descubrir nada que no se haya escrito ya sobre los caracteres Unicode, pero resulta curioso ver los grupos tan extraños y curiosos que existen de ellos.

Unicode
Foto por subgrafik

Para empezar ¿Qué es Unicode? Es un estándar de codificación de caracteres diseñado para facilitar la transmisión y visualización de textos en varios lenguajes, ya sean lenguas extranjeras (mandarín, árabe, griego), lenguajes tećnicos (científicos) o lenguas muertas (latín).

Para que nos entendamos. Los ordenadores solo saben trabajar con números, con lo cual, lo que hace Unicode es asignar un único número a cada caracter. Quizás os suene más el código Ascii. Pues bien, el código Ascii es un código de caracteres basado en el alfabeto latino tal y como se usa en el inglés moderno y otras lenguas occidentales. Dichas lenguas son muy simples y con 127 caracteres bastaban (es decir, asignando a cada caracter un único número del 0 al 127)  o 255 para el español o francés ya que incluye acentos y demás carateres raros (¿¡ñ'ç).
El problema viene cuando un ordenador manda una información en código Ascii a otro ordenador que no lo interpreta. Este último interpretará el número 65 (A mayúscula en Ascii) como cualquier otro caracter.
Aquí es cuando surge Unicode (ideado en 1987), para solucionar todo este tipo de incompatibilidades: cada caracter tiene un único número y cada número está asociado a un único caracter.

En la última versión de Unicode (de octubre de 2010) consta de 93 escrituras y 109449 caracteres. Pero, alguno mirando el teclado, se preguntará ¿como puedo escribir esos más de 100.000 caracteres si mi teclado solo tiene 105 teclas? Depende del sistema operativo que tengas, veamos:
Como he dicho antes, cada caracter en Unicode tiene asignado un número, pues bien, solo hay que presionar una combinación de teclas + el número para mostrar dicho caracter:
  • En Windows: Alt + número.
  • En Linux (por lo menos en Ubuntu): Shift + Control + u, soltamos y continuación escribimos el número.
  • En Mac: Leer aquí, ya que desconozco este S.O
Bien, ahora solo falta saber cuales son esos números para poder escribir los caracteres con nuestro teclado. En la página oficial del estandar Unicode tienen decenas de tablas con todos los códigos para escribir caracteres según el tipo de alfabeto que te interese.
Aclarar que dichos números son en formato hexadecimal (del 0 a la F).

Pero bueno, si he decidido escribir esta entrada es por lo mucho que me llaman la atención algunos caracteres existentes, así que vamos al grano. Seguramente los habrás visto en algún nick de algún amigo raro del messenger o del facebook, son del estilo °º¤ø,¸¸,ø¤º°`°º¤ø,¸ƒ®ånKëîn姰º¤ø,¸¸,ø¤º°`°º¤ø,¸. Con el tiempo acaban cansando y uno acaba odiando a estas personas ☺.

Hay decenas de grupos, los más curiosos son estos:

Los símbolos miscelánea (de todo un poco):
Van de los números 2600 al 26FF.
Entre estos tenemos algunos símbolos muy adecuados para estos días tales como el muñeco de nieve (2603), el paraguas (2602) o el símbolo de la farmacia (la serpiente y el palo) ⚕.
En esta categoría encontramos los signos del zodiaco , los dados ⚀ ⚁ ⚂ ⚃ ⚄ ⚅, las fichas del ajedrez ♔ ♕ ♖ ♗ ♘ ♙ ♚ ♛ ♜ ♝ ♞ ♟ o símbolos religiosos e ideológicos ☥ ☦ ☧ ☨ ☩ ☪ ☫ ☬ ☭ ☮ ☯
Ver todos los símbolos miscelánea.


Existen también todo tipo de flechas.
Del 2190 al 21FF.
← ↑ → ↓ ↔ ↕ ↖ ↗ ↘ ↙ ↚ ↛ ↜ ↝ ↞ ↟
Ver todas las flechas.


También se pueden dibujar cajas y bloques.
Del 2500 al 257F para las cajas y del 2580 al 259F para los bloques.
┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ ┚ ┛ ├ ┝ ┞ ┟
▀ ▁ ▂ ▃ ▄ ▅ ▆ ▇ █ ▉ ▊ ▋ ▌ ▍ ▎ ▏
Con un poco de maña se pueden dibujar cajas como estas:

Ver todos los elementos para dibujar cajas.
Ver todos los elementos para dibujar bloques.


Figuras geométricas.
Del 25A0 al 25FF
□ ▱ ◁ ▢ ▲ ◂ ▣ △ ◃ ▤ ▴ ◄ ▥ ▵ ◅ ▦ ▶ ◆
Ver todas las formas geométricas


Símbolos Dingbat.
Del 2700 al 27BF
Podríamos decir que son también tipo miscelánea ya que hay un poco de todo:
✁ ✂ ✄ ✆ ✇ ✈ ✉ ✌ ✍ ✎ ✏ ✐ ✑ ✒ ✓ ✔ ✕ ✖ ✗ ✘ ✙ ✚ ✛ ✜ ✝ ✞ ✟ ✠ ✡ ✢ ✣ ✤ ✥ ✦ ✧ ✩ ✪ ✫ ✬ ✭ ✮ ✯ ✰ ✱ ✲ ✳ ✴ ✵ ✶ ✷ ✸ ✹ ✺ ✻ ✼ ✽ ✾ ✿ ❀ ❁ ❂ ❃ ❄ ❅ ❆ ❇ ❈ ❉ ❊ ❋
Ver todos los dingbats.


Símbolos matemáticos.
∀ ∁ ∂ ∃ ∄ ∅ ∆ ∇ ∈ ∉ ∊ ∋ ∌ ∍ ∎ ∏ ∐ ∑ − ∓ ∔ ∕ ∖ ∗ ∘ ∙ √ ∛ ∜ ∝ ∞ ∟ ∠ ∡ ∢ ∣ ∤ ∥ ∦ ∧ ∨ ∩ ∪ ∫ ∬ ∭ ∮ ∯

Hasta en Braille podemos escribir (no se muy bien con que sentido):
¦⠕⠥⡅⡕⡥⡵⢅⢕⡇⡧⡷⢇⢗⢧⢧⢨⢩⢪⢫⢬⢭⢮⢯⣧⣷⣸⣹⣺⣻⣼⣽⣾⣿


En definitiva, hay muchísimos caracteres raros. Me hace pensar lo rico que puede ser nuestro vocabulario a través de un ordenador. Seguro que hay un montón de gente que lo desconoce. Claro que los que los conocen, les da pereza usarlos. Normal, con tanto número que recordar. Pero, están ahí.

Hay muchas páginas en la wikipedia que hablan del estandar Unicode. La categoría Unicode está llena de enlaces a ellas. También de tablas.
Y la página decodeunicode es de lo mejorcito que he encontrado para poder ver todos los caracteres que existen.

Entradas relacionadas:
Feshfonts: tipografías con ketchup 
Añadir más fuentes en Blogger

10 comentarios:

Anónimo dijo...

A la hora de imprimir los envases de medicamnetos se utiliza el lenguaje Braille, utilizándose esta familia tipográfica para la representación en pantalla.

franKeinas dijo...

Genial apunte anónimo 2, no lo había pensado.

Gracias y un saludo.

Al Marqz dijo...

Si alguien me pudiera decir como hacer la arroba con "e" le agradecería bastante... saludos.

Anónimo dijo...

ALGUIEN K ME DIGA COMO C HACE EL PARAGUAS

Calderas Ferroli dijo...

esas cosa son para la mara que no tiene nada que hacer

Anónimo dijo...

Olas disculpen como ago los audios

Anónimo dijo...

si en el mapa de caracteres dice U+2569 (╩), Como hago para saber que la combinacion es Alt + 202?
Esa la supe al intentar hacer otra (U+202E)

Publicar un comentario en la entrada