NOMES DE DOMÍNIO INTERNACIONALIZADOS (IDNs)

Regras de registro

O Sistema de Registro Compartilhado (SRS) da Verisign permite a criação de nomes de domínio internacionalizados (IDNs) que contêm vários scripts com Unicode.

A Verisign desenvolveu uma política para registros de IDN, especificando pontos de código permitidos e proibidos. A política é implementada nas cinco regras de validação a seguir. Os IDNs que respeitam essas cinco regras são considerados registros válidos.

1. Padrões de IETF

A especificação IDNA2008 define as regras e algoritmos que permitem/proíbem os pontos Unicode nos registros IDN. A Verisign está em total conformidade com todos os documentos RFC que abrangem o padrão IDNA2008. Revise os padrões da IETF.

2. Restrições em idiomas específicos

Todos os registros de IDN exigem uma guia de idioma de três letras. CHI, por exemplo, é para o idioma chinês. Se a guia de idioma associada com o registro estiver na tabela a seguir, então a Verisign tem uma lista dos caracteres incluídos para esse idioma. O IDN solicitado deve estar inteiramente contido nesta lista dos caracteres incluídos. Se até mesmo um ponto de código do IDN não for um caractere válido para esse idioma, o registro será rejeitado.

A tabela a seguir lista os idiomas que têm uma lista dos caracteres incluídos associada.

GUIA DE IDIOMA IDIOMA
AZE Azeri
BEL Bielorrusso
BUL Búlgaro
CHI Chinês
GRE Grego
JPN Japonês
KOR Coreano
KUR Curdo
MAC Macedônio
MOL Moldaviano
POL Polonês
RUS Russo
SCC Sérvio
SCR Croata
SRP Sérvio
UKR Ucraniano

3. Restrições adicionais na combinação de scripts

Se a guia de idioma especificada no registro IDN não estiver na tabela acima, e portanto não tem uma lista dos caracteres incluídos, a Verisign aplica uma restrição alternativa para impedir a combinação de scripts diferentes em um único domínio.

O padrão Unicode define um conjunto de scripts de Unicode atribuindo para cada ponto de código um valor de script de Unicode. Via de regra, os registros da Verisign rejeitam a combinação de pontos de código de diferentes scripts de Unicode. Isso é, se um IDN contém pontos de código de dois ou mais scripts de Unicode, o registro de IDN é rejeitado. Por exemplo, um caractere do script latino não pode ser usado no mesmo IDN com uma letra do alfabeto cirílico. Todos os pontos de código dentro de um IDN devem vir do mesmo script de Unicode. Isso é feito para evitar que pontos de código que possam ser confundidos apareçam no mesmo IDN.

Novamente, essa regra só se aplica a idiomas para os quais não haja lista dos caracteres incluídos estritamente definida. Por exemplo, a guia de idioma FRE, que indica o francês, não tem uma lista dos caracteres incluídos estrita, e assim se aplica a regra de combinação. Todos os pontos de código em um domínio francês devem vir de um script único. Mas esse script pode ser qualquer um dos scripts válidos definidos pelo Unicode.

A tabela a seguir lista os scripts de Unicode, e a tabela associada dos pontos de código permitidos.

Scripts de Unicode e pontos de código associados

Para obter uma lista abrangente de todos os pontos Unicode permitidos para registro de IDN, clique aqui.

4. Pontos Unicode restritos da ICANN

O Verisign SRS também respeita as Diretrizes para Implementação de Nomes de domínio internacionalizados da ICANN. A Seção 5 do documento descreve os caracteres que são permitidos pelo padrão IETF, mas que devem ser proibidos para registro de IDN. Por essa razão, o SRS da Verisign proíbe os seguintes pontos de código Unicode em todos os registros. Uma lista completa dos pontos Unicode restritos da ICANN está aqui.

5. Caracteres especiais

Há exatamente dois (2) caracteres Unicode cujas últimas definições não são compatíveis com versões anteriores do padrão IDNA. O Sharp S latino e o sigma final grego foram previamente mapeados para caracteres alternativos. Os clientes e registros compatíveis com o padrão mais antigo mapeariam, por exemplo, um Sharp S latino em dois caracteres "S" minúsculos latinos. Este mapeamento é irreversível. A versão mais recente do padrão IDNA não se aplica a esse mapeamento. Assim, enquanto o Sharp S latino foi proibido antes (mapeado em outros caracteres), o padrão mais recente permite que os registros aceitem este caractere a seu próprio critério.

Como essas alterações não são compatíveis com versões anteriores, a Verisign optou por continuar não permitindo esses dois (2) caracteres, até que tenha sido atingida e comunicada uma abordagem clara e justa para o seu registro.

CARACTERE PONTO UNICODE GLIFO
Letra minúscula latina Sharp S U+00DF ß
Letra minúscula grega sigma final U+03C2 ς