ESCRITURAS E IDIOMAS

Los nombres de dominio internacionalizados (IDN) son nombres de dominio de segundo o tercer nivel o direcciones web registradas en cualquier paquete de caracteres o escrituras definidas en Unicode.


Entender cómo apoya el IDN de Verisign el registro de nombres de dominio en cientos de idiomas nativos con un único Shared Registration System (SRS) requiere comprender el uso de los caracteres y las escrituras en la lengua escrita y traducida para los ordenadores.

RELACIÓN ENTRE ESCRITURA, CARÁCTER E IDIOMA

ESCRITURALatinoÁrabehanGriego
CARÁCTERLس漢字Ω
IdiomaInglésFarsiChinoGriego

ESCRITURA

Una escritura es una colección de símbolos que se usan para representar información textual en un idioma. Ejemplos de escritura: latina, árabe, han, griega.

CARÁCTER

Un carácter es el cimiento de cualquier escritura y, por tanto, de cualquier lengua escrita. Implica un significado a nivel fundamental; no se puede partir más sin que deje de tener significado.

LENGUA ESCRITA

Una lengua escrita usa caracteres de uno o más escrituras para comunicar un significado. Ejemplos de lenguas: inglés, farsi, chino, griego.

ADAPTACIÓN DE LAS LENGUAS A LOS ORDENADORES

Las diferentes escrituras usan teclados normales o en pantalla distintos para introducir datos en los ordenadores. Los sistemas operativos de los ordenadores tienen editores de método de entrada (IME) que facilitan la introducción de escrituras diferentes. Los IDN tienen un tipo similar de adaptación, que permite el uso de la escritura local para navegar por la red, enviar y recibir mensajes, transferir archivos y otras aplicaciones que requieren nombres de dominio.

UNICODE

Un ordenador usa la codificación de caracteres para comprenderlos. Cada carácter en un paquete de caracteres se asigna a un número en concreto. Por ejemplo, en el paquete de caracteres ASCII, la "A" mayúscula se asigna al número 65. Muchos nombres de dominio se registran con caracteres ASCII (de la A a la Z, de 0 a 9 y el guión “-“). Sin embargo, las palabras no inglesas que necesitan diacríticos, como el español y el francés, y las lenguas que usan escrituras no latinas, como el japonés y el árabe, no se pueden reflejar con ASCII. Unicode es un paquete de códigos universal que cubre al menos 350 idiomas distintos. Por este motivo, los IDN utilizan Unicode.

ETIQUETAS DE IDIOMA

La infraestructura IDN de Verisign cumple con las normas del Comité de Implementación de Registro (RIC) de ICANN y solicita que todos los IDN se asocien con un idioma específico usando una "etiqueta de idioma". El registrante elige la etiqueta de idioma IDN durante el proceso de registro. Si un IDN combina más de una lengua, el registrante tiene que seleccionar el idioma más apropiado. (No todas las etiquetas de idioma tienen referencias actualmente; sin embargo, capturar la información durante el proceso de registro permitirá adoptar las tablas de idiomas en el futuro). Descargue la lista en PDF de Verisign Valid Language Tags

TABLAS DE IDIOMAS

Cuando se solicita un registro IDN, la etiqueta de idioma se compara con una lista de idiomas que tienen tablas de inclusión de caracteres o tablas de enlace a variantes de caracteres. Estas tablas se aplican a los puntos de código Unicode que forman parte de un registro para determinar si es válido para un idioma en concreto. Si el registro falla para un idioma, el conjunto de caracteres puede seguir estando disponible con otra etiqueta de idioma.