Recursos de canales

Nombres de dominio internacionalizados

Descubra el poder de los .com y .net en idiomas locales

Abra un mundo de oportunidades con nuevos clientes, nuevos registros y servicios web en expansión.

Los nombres de dominio internacionalizados (IDN) de Verisign permiten a las empresas expresar sus dominios .com y .net en los caracteres de sus idiomas locales. Es una manera más amigable y significativa de conectarse con los clientes.

La historia de los IDN

En 1996, aproximadamente dos tercios de todos los usuarios de internet se encontraban en los Estados Unidos, por lo que el idioma inglés y los caracteres latinos (también conocidos como ASCII) fueron la base para navegar la web. Sin embargo, desde ese entonces, según el informe sobre el Estado de internet global y local de Comscore de 2012, la población de internet que no habla inglés creció un 87%; la región de Asia-Pacífico representa el 41,1% de los usuarios de internet de todo el mundo.

En un principio, los nombres de dominio solo eran compatibles con caracteres ASCII (A a Z, 0 a 9 y el guion "-"), por lo que no se podía navegar internet usando palabras no inglesas que requirieran acentos ortográficos (como acentos, diéresis, breves, puntos, etc.), ni en otros idiomas que usaran caracteres no latinos, como hangul, árabe, tailandés, chino simplificado y otros.

Considerando que se accede a internet cada vez más desde países no occidentales, la introducción de caracteres no latinos es un adelanto oportuno para los registradores y sus clientes. Este avance brinda oportunidades en nuevos mercados tanto para registradores regionales como globales que busquen expandir su negocio.

En el 2000, Verisign introdujo los nombres de dominio internacionalizados de segundo nivel (a la izquierda del punto) para .com y .net. Esto permitió que nombres de dominio como 스타벅.com puedan ser creados, registrados y buscados, haciendo internet más accesible y relevante para millones de usuarios.

En 2012, Verisign solicitó operar los registros de ocho transliteraciones de .com y tres de .net (a la derecha del punto) a través del nuevo programa de dominios genéricos de primer nivel (gTLD) de la ICANN para poder trasladar los nombres de dominio completos de las empresas a los caracteres usados por los idiomas locales.

El plan propuesto por Verisign para estos nuevos IDN gTLD ayudará a asegurar una experiencia universal del usuario final y a evitar que consumidores y empresas deban registrar nombres de dominio puramente defensivos en nuestros TLD. En la práctica, el plan propuesto por Verisign logra que el registrante de un nombre de dominio de segundo nivel en nuestros IDN.IDN, IDN.com o IDN.net tenga el derecho exclusivo, sin perjuicio de los mecanismos de protección de los derechos correspondientes, pero no la obligación, de registrar ese mismo nombre de segundo nivel en otros IDN de primer nivel, incluso .com o .net, según corresponda.

A fin de ilustrar nuestro enfoque, identificamos a continuación dos casos de uso:

Caso de uso No. 1: Juan Pérez ya tiene el registro de un nombre de dominio de segundo nivel IDN.net. Ese nombre de dominio de segundo nivel estará disponible en todos los nuevos TLD .net, únicamente para Juan Pérez. Juan Pérez puede elegir no registrar ese nombre de dominio de segundo nivel en las nuevas transliteraciones de los TLD .net.

Caso de uso No. 2: José Rodríguez no tiene un registro de un nombre de dominio de segundo nivel IDN.com. José Rodríguez registra un nombre de dominio de segundo nivel en nuestra transliteración de .com en tailandés, pero en ningún otro TLD. Ese nombre de dominio de segundo nivel no estará disponible en las demás transliteraciones de IDN de TLD .com ni en el registro de .com, a no ser que José Rodríguez (y únicamente José Rodríguez), lo registre en el IDN de TLD .com o en el registro de .com.

Versiones en idiomas locales de .com y .net

Verisign solicitó nueve transliteraciones de .com y tres de .net como parte del nuevo programa de dominios genéricos de primer nivel (gTLD) a fin de lograr que los nombres de dominios completos de las empresas pueden ser escritos con los caracteres del idioma local.

.com
.net
.com

Cirílico

.net

Devanagari

.com

Hebreo

.net

Chino simplificado

.com

Árabe

.net

Hangul

.com

Devanagari

.com

Tailandés

.com

Katakana

.com

Chino simplificado

.com

Hangul

El proceso de registro de IDN


El registrante solicita un IDN a un registrador que admita IDN. El registrador convierte los caracteres del idioma local en una secuencia de letras compatibles usando una codificación compatible con ASCII (ACE). El registrador envía la cadena de codificación ACE al sistema Verisign® Shared Registration System para ser validada. El IDN se agrega a los archivos de zona de TLD .com y .net y se propaga por toda la internet.


Proceso de resolución de IDN

Cuando un usuario ingresa un IDN usando su escritura nativa en un navegador o hace clic en un vínculo, las aplicaciones compatibles con IDN codifican los caracteres en una cadena de codificación ACE que el DNS interpreta correctamente. El DNS procesa la solicitud y devuelve la información a la aplicación. Si bien el proceso parece simple, el hecho de que las aplicaciones compatibles con IDN y el DNS interpreten correctamente diferentes idiomas y escrituras ha requerido considerables investigaciones y desarrollos.

Normas de la IETF



La Comisión de Ingeniería de Internet (IETF) encabezó la iniciativa de creación de normas para la utilización de caracteres no ASCII en el Sistema de Nombres de Dominio (DNS).

El DNS sólo reconoce los caracteres ASCII A-Z, 0-9 y "-". Esto limita el número de caracteres que pueden utilizarse para crear nombres de dominio a 37 de los más de 96.000 caracteres identificados en Unicode. Para crear nombres de dominio a partir de la variedad de caracteres de Unicode, debe usarse y normalizarse un esquema de codificación de caracteres que asigne de manera única los puntos de código de Unicode a una representación de ASCII.

La IETF publicó estas normas relacionadas con los Nombres de Dominio Internacionalizados (IDN): esquemas de codificación, marco de trabajo, protocolo, Unicode y escrituras de derecha a izquierda.

Esquema de codificación

El esquema de codificación para IDN usa Punycode, una codificación compatible con ASCII (ACE) que codifica los caracteres del idioma local en caracteres ASCII de modo que el DNS pueda responder exactamente a una solicitud de registro de dirección. Para seleccionar Punycode como la norma ACE, la IETF consideró el equilibro entre la compresión y la implementación. Punycode permite que se represente el mayor número de caracteres (puntos de código o códigos) y no es difícil de utilizar.

Marco de trabajo [RFC 5890]

Esta RFC es parte de un grupo que, en su conjunto, describe el protocolo y el contexto de uso para la reforma de los Nombres de Dominios Internacionalizados en Aplicaciones (IDNA). Esta reforma fue completada en su mayoría en el año 2008, por lo que esta serie se conoce en general como "IDNA2008". Esta serie sustituye a una versión anterior de IDNA [RFC 3490] [RFC 3491]. Por conveniencia, a esa versión de IDNA se le llama "IDNA2003". La nueva versión continúa utilizando el algoritmo Punycode [RFC 3492] y el prefijo ACE (codificación compatible con ASCII) de la versión anterior.

Protocolo [RFC 5891]

Esta RFC describe el protocolo principal de la serie IDNA2008 y sus operaciones. Junto con el documento bidireccional (Bidi) detallado a continuación, esta RFC actualiza y sustituye a la [RFC 3490].

Unicode [RFC 5892]

Esta RFC especifica las reglas para decidir si un código, considerado de forma aislada o en su contexto, puede incluirse en un IDN. Es parte de las especificaciones de IDNA2008.

Escrituras de derecha a izquierda [RFC 5893]

El uso de la escritura de derecha a izquierda en los Nombres de Dominios Internacionalizados (IDN) ha presentado varios desafíos. Esta RFC proporciona nuevas reglas bidireccionales para las etiquetas de los nombres de dominio internacionalizados en aplicaciones (IDNA), basadas en los problemas surgidos en algunas escrituras y limitaciones del criterio bidireccional IDNA2003.

Fundamentos [RFC 5894]

Esta RFC proporciona los antecedentes, fundamentos y explicaciones que justifican la necesidad de nuevas RFC para enfrentar los problemas que han surgido en las versiones anteriores de los IDNA. En esta RFC también se debate la necesidad de actualizar la versión de Unicode compatible con los IDNA.

RFC PUBLICADAS

Estas normas han sido publicadas y ahora están disponibles:

Verisign se compromete a seguir las normas de la IETF y apoyar el desarrollo rápido de esta nueva tecnología.

Escrituras + Idiomas



Los nombres de dominio internacionalizados (IDN) son nombres de dominio o direcciones web de segundo o tercer nivel registrados en cualquier escritura o conjunto de caracteres definidos en Unicode.

Para comprender cómo los IDN de Verisign dan soporte al registro de nombres de dominio en cientos de idiomas nativos con un único sistema de registro compartido (SRS), se requiere una comprensión de la manera en que los caracteres y las escrituras se usan en el idioma escrito y se traducen para la informática.

Relación entre la escritura, el carácter y el idioma

ESCRITURA Latín Árabe Han Griego
CARÁCTER B س 漢字 Ω
Idioma Inglés Parsi Chino Griego

Escritura

Una escritura es una colección de símbolos usados para representar información textual en un idioma. Ejemplos de escrituras: latina, árabe, han, griega.

Carácter

Un carácter es el componente básico de cualquier escritura y por lo tanto de cualquier idioma escrito. Éste invoca un significado en un nivel fundamental; no es posible separar un carácter en partes y mantener su significado.

Idioma escrito

Un idioma escrito utiliza caracteres de uno o más tipos de escritura para comunicar un significado. Ejemplos de idiomas: inglés, parsi, chino, griego.

Adaptación de idiomas a las computadoras

Distintas escrituras usan distintos teclados o teclados virtuales para su ingreso en dispositivos informáticos. Los sistemas operativos de computadoras tienen Editores de Métodos de Entrada (IME) que facilitan el ingreso de diferentes escrituras. Los IDN son un tipo de adaptación similar, que permiten que las personas usen la escritura de su idioma local para navegar en la web, enviar y recibir correos electrónicos, transferir archivos y otras aplicaciones que requieren nombres de dominio.

Unicode

Una computadora usa codificación de caracteres para comprenderlos. Cada caracter dentro de un conjunto de caracteres se asigna a un número único. Por ejemplo, en el conjunto de caracteres de código ASCII, la mayúscula "A" se asigna al número 65. La mayoría de los nombres de dominio se registran en caracteres ASCII (A a Z, 0 a 9 y el guión “-“). Sin embargo, las palabras de idiomas diferentes al inglés que requieren acentos ortográficos, como el español y el francés, o que usan escrituras no latinas, como el kanji y el árabe, no se pueden representar en ASCII. Unicode es un conjunto universal de caracteres codificados que abarca hasta 350 idiomas nativos distintos. Por este motivo, los IDN usan Unicode.

Etiquetas de idioma

La infraestructura de los IDN de Verisign cumple con las normas del Comité de implementación del registro ICANN (RIC) y exige que cada IDN esté asociado con un idioma específico usando una "etiqueta de idioma". El registrante selecciona la etiqueta de idioma durante el proceso de registro. Si un nombre de dominio internacionalizado (IDN) combina más de un idioma, el registrante debe seleccionar el idioma más adecuado. No todas las etiquetas de idiomas tienen referencia actualmente; sin embargo, capturar la información durante el proceso de registro permite que se puedan adoptar tablas de idiomas en el futuro. Descargue la lista en PDF Verisign Valid Language Tags

Tablas de idiomas

Cuando se solicita un registro IDN, se verifica la etiqueta de idiomas en una lista de idiomas que tienen tablas de inclusión de caracteres o tablas de mapeo de variantes de caracteres. Estas tablas se aplican a los códigos Unicode que componen un registro para determinar si el registro es válido para un idioma específico. Si el registro falla para un idioma, puede que el conjunto de caracteres aún esté disponible con una etiqueta de idioma diferente.

Variantes de caracteres


Verisign trabaja junto con las partes interesadas para solucionar el problema de las variantes de caracteres. Los registrantes habitualmente registran los nombres de dominio que tienen significado en su propio idioma como un nombre, palabra o frase. Sin embargo, una sola escritura puede ser usada por más de un idioma.

Como resultado, un nombre de dominio puede tener distintos significados en el contexto de otros idiomas o culturas. El fenómeno de las variantes se ha clasificado en cuatro categorías distintas: variantes de caracteres, ortográficas, lexémicas y contextuales. Verisign ha determinado que tratar variantes de caracteres es fundamental para permitir que los usuarios naveguen en internet en sus propios idiomas. Las otras variantes requieren juicios lingüísticos difíciles que no son fundamentales para brindar una solución sólida de nombres de dominio internacionalizados (IDN).

Variantes de caracteres chinos

Muchos idiomas pueden tener variantes de caracteres que podrían confundir a los usuarios finales. Por ejemplo, el idioma chino tiene dos formas escritas: chino simplificado, que se usa principalmente en la China continental, y chino tradicional, usado principalmente en Taiwán, Hong Kong y otros países del sudeste de Asia. Ambas escrituras comparten muchos caracteres; sin embargo, algunos caracteres simplificados del chino simplificado pueden tener el mismo significado que algunos caracteres complejos del chino tradicional. Estos caracteres, llamados variantes de caracteres, tienen el mismo significado y la misma pronunciación, pero su apariencia es diferente.

Una solución a las variantes de caracteres

Distintos pensadores de la comunidad técnica han sugerido sus propias teorías sobre cómo tratar el problema de las variantes de caracteres. Cada teoría tiene sus aspectos positivos y negativos. Sin embargo, la comunidad de nombres de dominio internacionalizados (IDN) entiende que el problema de las variantes de caracteres nunca podrá solucionarse por completo, ya que los idiomas cambian constantemente. Siempre seguirán apareciendo nuevas variantes dentro de los idiomas. Verisign ha adoptado el uso de etiquetas de idioma relacionadas con tablas de idiomas para tratar el problema de las variantes de caracteres.

Verisign ha trabajado en solucionar el problema de las variantes de caracteres con sus accionistas más interesados en dicho problema, entre ellos el Centro de Información de Redes de China (CNNIC) (.cn), el Centro de Información de Redes de Taiwán (TWNIC) (.tw), la Agencia Nacional para el Desarrollo de Internet de Corea (.kr), el Operador de Registro de Japón (JPRS) (.jp), el Consorcio de Nombres de Dominio en Chino (CDNC) y el Comité de implementación de nombres de dominio internacionalizados (IDN) establecido por la ICANN.

Políticas

Verisign ha desarrollado una política para los registros de nombres de dominio internacionalizados (IDN) que especifica los códigos permitidos y los prohibidos.

El sistema de registro compartido (SRS) de Verisign permite la creación de nombres de dominio internacionalizados (IDN) que contengan caracteres no ASCII admitidos por Unicode.

Reglas de registro

Obtenga más información sobre las cinco reglas de validación mediante las cuales se implementa la política.


Ver reglas

Lógica adicional

Luego de validar un nombre de dominio internacionalizado (IDN), Verisign ejecuta alguna lógica adicional basándose en la etiqueta de idioma del registro.


Ver lógica adicional