REGRAS DE REGISTRO

REGRAS DE REGISTRO

O Sistema de Registro Compartilhado (SRS) da Verisign permite a criação de Internationalized Domain Names (Nomes de domínio internacionalizados) (IDNs) que contêm vários scripts com Unicode.


A Verisign desenvolveu uma política para registros de IDN, especificando pontos de código permitidos, restritos e proibidos. A política é implementada nas cinco regras de validação a seguir. Os IDNs que respeitam essas cinco regras são considerados registros válidos.

1. PADRÕES DE IETF

A especificação IDNA2008 define as regras e algoritmos que permitem/proíbem os pontos Unicode nos registros IDN. A Verisign está em total conformidade com todos os documentos RFC que abrangem o padrão IDNA2008. Revise os padrões da IETF.

2. RESTRIÇÕES EM IDIOMAS ESPECÍFICOS

Todos os registros IDN exigem uma marcação de idioma de três letras. CHI, por exemplo, é para o idioma chinês. Se a Guia de Idioma associada com o registro estiver na tabela a seguir, então a Verisign tem uma Lista de Caracteres Incluídos para esse idioma. O IDN solicitado deve estar inteiramente contido nesta Lista de Caracteres Incluídos. Se até mesmo um ponto de código do IDN não for um caractere válido para esse idioma, o registro será rejeitado.

A tabela a seguir lista os idiomas que têm uma Lista de Caracteres Incluídos associada.

GUIA DE IDIOMA IDIOMA
AZE Azeri
BEL Bielorrusso
BUL Búlgaro
CHI Chinês
GRE Grego
JPN Japonês
KOR Coreano
KUR Curdo
MAC Macedônio
MOL Moldaviano
POL Polonês
RUS Russo
SCC Sérvio
SCR Croata
SRP Sérvio
UKR Ucraniano

3. RESTRIÇÕES ADICIONAIS NA COMBINAÇÃO DE SCRIPTS

Se a Guia de idioma especificada no registro IDN não estiver na tabela acima, e portanto não tem uma Lista de Caracteres Incluídos, a Verisign aplica uma restrição alternativa para impedir a combinação de scripts diferentes em um único domínio.

O Padrão Unicode define um conjunto de scripts de Unicode atribuindo para cada ponto de dado de Unicode um valor de script de Unicode. Via de regra, os registros da Verisign rejeitam a combinação de pontos de código de diferentes scripts de Unicode. Isso é, se um IDN contém pontos de código de dois ou mais scripts de Unicode, o registro de IDN é rejeitado. Por exemplo, um caractere do script latino não pode ser usado no mesmo IDN com uma letra do alfabeto cirílico. Todos os pontos de código dentro de um IDN devem vir do mesmo script de Unicode. Isso é feito para evitar que pontos de código que possam ser confundidos apareçam no mesmo IDN.

Novamente, essa regra só se aplica a idiomas para os quais não haja Lista de Caracteres Incluídos estritamente definida. Por exemplo, a Guia de Idioma FRE, que indica o francês, não tem uma Lista de Caracteres Incluídos estrita, e assim se aplica a regra de combinação. Todos os pontos de código em um domínio francês devem vir de um script único. Mas esse script pode ser qualquer um dos scripts válidos definidos pelo Unicode.

A tabela a seguir lista os scripts de Unicode, e a tabela associada dos pontos de código permitidos.

SCRIPTS DE UNICODE E PONTOS DE CÓDIGO ASSOCIADOS
Árabe Georgiano Latim Rejang
Armênio Glagolítico Lepcha Rúnico
Avestan Grego Limbu Samaritano
Balinês Gujarati Lisu Saurashtra
Bamum Panjabi Liciano Cingalês
Batak Han Lidiano Sundanês
Bengali Hangul Malaiala Syloti Nagri
Bopomofo Hanunoo Mandaico Siríaco
Brahmi Hebraico Meetei Mayek Tagalog
Buginês Hiragana Mongol Tagbanwa
Buhid Aramaico imperial Mianmar Tai Le
Aborígene canadense Pálavi inscripcional New Tai Lue Tai Tham
Carian Partiano inscripcional Nko Tai Viet
Cham Javanês Ogham Tâmil
Cheroqui Kaithi Ol Chiki Télugo
Cóptico Canarês Persa Antigo Thaana
Cuneiforme Katakana Árabe do Sul Antigo Tailandês
Cirílico Kayah Li Turco Antigo Tibetano
Devanágari Kharoshthi Oriá Tifinagh
Hieróglifo egípcio Khmer Phags Pa Vai
Etiópico Lao Fenício Yi

Para obter uma lista abrangente de todos os pontos Unicode permitidos para registro IDN, clique aqui.

4. PONTOS UNICODE RESTRITOS DA ICANN

O Verisign SRS também respeita as Diretrizes para Implementação de Internationalized Domain Names (Nomes de domínio internacionalizados) da ICANN. A Seção 5 do documento descreve os caracteres que são permitidos pelo padrão IETF, mas que devem ser proibidos para registro IDN. Por essa razão, o SRS da Verisign proíbe os seguintes pontos de código Unicode em todos os registros. Uma lista completa dos pontos Unicode restritos da ICANN está aqui.

5. CARACTERES ESPECIAIS

Há exatamente dois (2) caracteres Unicode cujas últimas definições não são compatíveis com versões anteriores do padrão IDNA. O Sharp S latino e o sigma final grego foram previamente mapeados para caracteres alternativos. Os clientes e registros compatíveis com o padrão mais antigo mapeariam, por exemplo, um Sharp S latino em dois caracteres "S" minúsculos latinos. Este mapeamento é irreversível. A versão mais recente do padrão IDNA não se aplica a esse mapeamento. Assim, enquanto o Sharp S latino foi proibido antes (mapeado em outros personagens), o padrão mais recente permite que os registros aceitem este caractere a seu próprio critério.

Como essas alterações não são compatíveis com versões anteriores, a Verisign optou por continuar não permitindo esses dois (2) caracteres, até que tenha sido atingida e comunicada uma abordagem clara e justa para o seu registro.

CARACTERE PONTO UNICODE GLIFO
Letra minúscula latina eszett U+00DF ß
Letra minúscula grega sigma final U+03C2 ς


PRECISA DE MAIS INFORMAÇÕES?