VARIANTES DE CARACTERES

Verisign ha trabajado con los grupos implicados para tratar el problema de las variantes de caracteres. Los registrantes suelen registrar nombres de dominio que tienen significado en su propio idioma, como un nombre, una palabra o una frase. Sin embargo, se puede usar una única escritura para más de un idioma.


Como resultado, un nombre de dominio puede tener distintos significados en el contexto de otros idiomas o culturas. El fenómeno de variantes se ha clasificado en cuatro categorías distintas: variantes de carácter, de ortografía, de léxico y de contexto. Verisign ha determinado que tratar las variantes de caracteres es esencial para permitir a los usuarios navegar por Internet en su propio idioma. Las otras variantes requieren valoraciones lingüísticas complejas que no son esenciales para ofrecer una solución IDN sólida.

VARIANTES DE CARACTERES CHINOS

Muchos idiomas pueden tener variantes en los caracteres que podrían causar confusión en el usuario final. Por ejemplo, el chino tiene dos formas escritas: el chino simplificado, que se usa principalmente en el centro de China, y el chino tradicional, usado especialmente en Taiwán, Hong Kong y otros países del sureste asiático. Las dos formas escritas comparten muchos caracteres; sin embargo, los caracteres del chino simplificado pueden tener el mismo significado que otros caracteres complejos del chino tradicional. Estos caracteres, llamados variantes de caracteres, tienen el mismo significado y pronunciación, pero no se parecen.

UNA SOLUCIÓN PARA LAS VARIANTES DE CARACTERES

Distintos líderes de la comunidad técnica han sugerido diferentes opciones para tratar al tema de las variantes de caracteres. Todas las opciones tienen aspectos positivos y negativos. Sin embargo, la comunidad IDN ve claro que la cuestión de las variantes de caracteres no se podrá solucionar nunca, puesto que los idiomas se encuentran en una fase de cambio continuo. Se seguirán introduciendo nuevas variantes de caracteres en los idiomas. Verisign ha adoptado etiquetas de idioma que hacen referencia a tablas de idiomas para tratar el tema de las variantes de caracteres.

Verisign ha trabajado con los grupos implicados para tratar el problema de las variantes de caracteres, como el Centro de Información de Internet de China (CNNIC) (.cn), Centro de Información de Redes de Taiwán (TWNIC) (.tw), la Agencia Nacional de Desarrollo de Internet de Corea (.kr), el Servicio de Registro de Japón (JPRS) (.jp), el Consorcio de Nombres de Dominio en Chino (CDNC) y el Comité de Implementación de IDN establecido por ICANN.

ETIQUETAS DE IDIOMA

La infraestructura IDN de Verisign cumple con las normas del Comité de Implementación de Registro (RIC) de ICANN y solicita que todos los IDN se asocien con un idioma específico usando una "etiqueta de idioma". El registrante elige la etiqueta de idioma IDN durante el proceso de registro. Si un IDN combina más de una lengua, el registrante tiene que seleccionar el idioma más apropiado. (No todas las etiquetas de idioma tienen referencias actualmente; sin embargo, capturar la información durante el proceso de registro permitirá adoptar las tablas de idiomas en el futuro. Descargue la lista de Verisign Valid Language Tags (PDF).

TABLAS DE IDIOMAS

Cuando se solicita un registro IDN, la etiqueta de idioma se compara con una lista de idiomas que tienen tablas de inclusión de caracteres o tablas de enlace a variantes de caracteres. Estas tablas se aplican a los puntos de código Unicode que realizan un registro para determinar si es válido para un idioma en concreto. Si el registro falla para un idioma, el conjunto de caracteres puede seguir estando disponible con otra etiqueta de idioma.

Tablas de idioma empleadas en la solución de variantes de caracteres de Verisign

IDIOMApuntos de código
Chino
Japonés
PolacoSólo caracteres latinos
GriegoU+002D, U+0030 a través de U+0039, U+0370 a través de U+03FF
RusoU+002D, U+0030 a través de U+0039, U+0400 a través de U+04FF, U+0500 a través de U+052F
BielorrusoU+002D, U+0030 a través de U+0039, U+0400 a través de U+04FF, U+0500 a través de U+052F
UcranianoU+002D, U+0030 a través de U+0039, U+0400 a través de U+04FF, U+0500 a través de U+052F
SerbioU+002D, U+0030 a través de U+0039, U+0400 a través de U+04FF, U+0500 a través de U+052F
MacedonioU+002D, U+0030 a través de U+0039, U+0400 a través de U+04FF, U+0500 a través de U+052F
BúlgaroU+002D, U+0030 a través de U+0039, U+0400 a través de U+04FF, U+0500 a través de U+052F

PUNTOS DE CÓDIGO IDN

Verisign Shared Registration System (SRS) permite al registrante que registre IDN a través de un registrador en cualquier tipo de escritura identificada en Unicode 5.2 y que cumpla la especificación del protocolo IDNA2008 (RFC 5891). Para permitir escrituras poco frecuentes, símbolos musicales y otros caracteres especiales, Verisign ha especificado puntos de código permitidos, restringidos y prohibidos en nuestra política de puntos de código IDN.