O Sistema de Registro Compartilhado (SRS) da Verisign permite a criação de Internationalized Domain Names (Nomes de domínio internacionalizados) (IDNs) que contêm vários scripts com Unicode.
A Verisign desenvolveu uma política para registros de IDN, especificando pontos de código permitidos, restritos e proibidos. A política é implementada nas cinco regras de validação a seguir. Os IDNs que respeitam essas cinco regras são considerados registros válidos.
A especificação IDNA2008 define as regras e algoritmos que permitem/proíbem os pontos Unicode nos registros IDN. A Verisign está em total conformidade com todos os documentos RFC que abrangem o padrão IDNA2008. Revise os padrões da IETF.
Todos os registros IDN exigem uma marcação de idioma de três letras. CHI, por exemplo, é para o idioma chinês. Se a Guia de Idioma associada com o registro estiver na tabela a seguir, então a Verisign tem uma Lista de Caracteres Incluídos para esse idioma. O IDN solicitado deve estar inteiramente contido nesta Lista de Caracteres Incluídos. Se até mesmo um ponto de código do IDN não for um caractere válido para esse idioma, o registro será rejeitado.
A tabela a seguir lista os idiomas que têm uma Lista de Caracteres Incluídos associada.
| GUIA DE IDIOMA | IDIOMA |
|---|---|
| AZE | Azeri |
| BEL | Bielorrusso |
| BUL | Búlgaro |
| CHI | Chinês |
| GRE | Grego |
| JPN | Japonês |
| KOR | Coreano |
| KUR | Curdo |
| MAC | Macedônio |
| MOL | Moldaviano |
| POL | Polonês |
| RUS | Russo |
| SCC | Sérvio |
| SCR | Croata |
| SRP | Sérvio |
| UKR | Ucraniano |
Se a Guia de idioma especificada no registro IDN não estiver na tabela acima, e portanto não tem uma Lista de Caracteres Incluídos, a Verisign aplica uma restrição alternativa para impedir a combinação de scripts diferentes em um único domínio.
O Padrão Unicode define um conjunto de scripts de Unicode atribuindo para cada ponto de dado de Unicode um valor de script de Unicode. Via de regra, os registros da Verisign rejeitam a combinação de pontos de código de diferentes scripts de Unicode. Isso é, se um IDN contém pontos de código de dois ou mais scripts de Unicode, o registro de IDN é rejeitado. Por exemplo, um caractere do script latino não pode ser usado no mesmo IDN com uma letra do alfabeto cirílico. Todos os pontos de código dentro de um IDN devem vir do mesmo script de Unicode. Isso é feito para evitar que pontos de código que possam ser confundidos apareçam no mesmo IDN.
Novamente, essa regra só se aplica a idiomas para os quais não haja Lista de Caracteres Incluídos estritamente definida. Por exemplo, a Guia de Idioma FRE, que indica o francês, não tem uma Lista de Caracteres Incluídos estrita, e assim se aplica a regra de combinação. Todos os pontos de código em um domínio francês devem vir de um script único. Mas esse script pode ser qualquer um dos scripts válidos definidos pelo Unicode.
A tabela a seguir lista os scripts de Unicode, e a tabela associada dos pontos de código permitidos.
Para obter uma lista abrangente de todos os pontos Unicode permitidos para registro IDN, clique aqui.
O Verisign SRS também respeita as Diretrizes para Implementação de Internationalized Domain Names (Nomes de domínio internacionalizados) da ICANN. A Seção 5 do documento descreve os caracteres que são permitidos pelo padrão IETF, mas que devem ser proibidos para registro IDN. Por essa razão, o SRS da Verisign proíbe os seguintes pontos de código Unicode em todos os registros. Uma lista completa dos pontos Unicode restritos da ICANN está aqui.
Há exatamente dois (2) caracteres Unicode cujas últimas definições não são compatíveis com versões anteriores do padrão IDNA. O Sharp S latino e o sigma final grego foram previamente mapeados para caracteres alternativos. Os clientes e registros compatíveis com o padrão mais antigo mapeariam, por exemplo, um Sharp S latino em dois caracteres "S" minúsculos latinos. Este mapeamento é irreversível. A versão mais recente do padrão IDNA não se aplica a esse mapeamento. Assim, enquanto o Sharp S latino foi proibido antes (mapeado em outros personagens), o padrão mais recente permite que os registros aceitem este caractere a seu próprio critério.
Como essas alterações não são compatíveis com versões anteriores, a Verisign optou por continuar não permitindo esses dois (2) caracteres, até que tenha sido atingida e comunicada uma abordagem clara e justa para o seu registro.
| CARACTERE | PONTO UNICODE | GLIFO |
|---|---|---|
| Letra minúscula latina eszett | U+00DF | ß |
| Letra minúscula grega sigma final | U+03C2 | ς |