VARIANTES DE CARACTERES

A Verisign vem trabalhando para resolver o problema das variantes de caracteres com as partes interessadas. Os usuários finais que registram domínios geralmente registram nomes de domínio que têm um significado na própria língua, por exemplo: nomes, palavras ou frases. No entanto, um único script pode ser usado por mais de uma língua.


Como resultado, um nome de domínio pode ter diferentes significados no contexto de outras línguas ou culturas. O fenômeno das variantes tem sido classificado em quatro categorias diferentes: variante de caractere, variante ortográfica, variante lexêmica e variante contextual. A Verisign determinou que dedicar-se a variantes de caracteres é essencial para permitir que os usuários naveguem na Internet em seus próprios idiomas. As outras variantes exigem um julgamento linguístico difícil que não é essencial para se chegar a uma solução resoluta para IDNs.

VARIAÇÕES DE CARACTERES CHINESES

Muitos idiomas poderão ter variações de caracteres que poderiam, potencialmente, causar confusão do usuário final. Por exemplo, o idioma chinês tem duas formas escritas: chinês simplificado, usado principalmente no continente, e chinês tradicional, usado principalmente em Taiwan, Hong Kong e outros países do sudoeste da Ásia. Os dois formulários escritos compartilham muitos caracteres; no entanto, caracteres simplificados em chinês simplificado poderão ter o mesmo significado que caracteres complexos em chinês tradicional. Esses caracteres, chamados de variações de caracteres, têm o mesmo significado e pronúncia, mas não a mesma aparência.

UMA SOLUÇÃO DA VARIAÇÃO DE CARACTERES

Diferentes líderes de pensamentos na comunidade técnica sugeriram diferentes abordagens para tratar o problema da variação de caracteres. Cada abordagem tem aspectos positivos e negativos. No entanto, a comunidade IDN está em acordo de que o problema da variação de caracteres poderá nunca ser totalmente tratada, pois os idiomas estão sempre em estado de mudança. Novas variações de caracteres entre idiomas continuarão a ser introduzidas em idiomas. A Verisign adotou marcações de idioma que referenciam tabelas de idiomas para tratar o problema da variação de caracteres.

A Verisign trabalhou para tratar o problema de variações de caracteres com partes interessadas, incluindo China Network Information Center (CNNIC) (.cn), Taiwan Network Information Center (TWNIC) (.tw), National Internet Development Agency of Korea (.kr), Japan Registry Service (JPRS) (.jp), o Chinese Domain Name Consortium (CDNC) e o IDN Implementation Committee estabelecido pela ICANN.

TAGS DE IDIOMA

A infraestrutura IDN da Verisign está em conformidade com o ICANN Registry Implementation Committee (RIC) e requer que cada Nome de Domínio Internacionalizado (IDN) esteja associado a um idioma específico usando uma "marcação de idioma". O solicitante do registro seleciona a tag de idioma do IDN durante o processo de registro. Se um IDN combinar mais de um idioma, a entidade que está fazendo o registro deverá selecionar o idioma mais apropriado. (Nem todas as marcações de idioma são referenciadas hoje; no entanto, capturar as informações durante o processo de registro permite a adoção de tabelas de idiomas no futuro.) Faça o download das Tags de idiomas válidas da Verisign (PDF).

TABELAS DE IDIOMAS

Quando um registro de IDN é solicitado, a guia de idioma é verificada com relação a uma lista de idiomas que tenham tabelas de inclusão de caracteres ou tabelas de mapeamento de variação de caracteres. Essas tabelas são aplicadas aos pontos de código Unicode que compõem um registro para determinar se o registro é válido para um idioma específico. Se o registro falhar para um idioma, o conjunto de caracteres ainda poderá estar disponível com uma tag de idioma diferente.

Tabelas de idioma implementadas na solução de variação de caracteres da Verisign

IDIOMAPontos de código
Chinês
Japonês
PolonêsSomente os caracteres latinos
GregoU+002D, U+0030 até U+0039, U+0370 até U+03FF
RussoU+002D, U+0030 até U+0039, U+0400 até U+04FF, U+0500 até U+052F
BielorrussoU+002D, U+0030 até U+0039, U+0400 até U+04FF, U+0500 até U+052F
UcranianoU+002D, U+0030 até U+0039, U+0400 até U+04FF, U+0500 até U+052F
SérvioU+002D, U+0030 até U+0039, U+0400 até U+04FF, U+0500 até U+052F
MacedônioU+002D, U+0030 até U+0039, U+0400 até U+04FF, U+0500 até U+052F
BúlgaroU+002D, U+0030 até U+0039, U+0400 até U+04FF, U+0500 até U+052F

PONTOS DE CÓDIGO IDN

O Sistema de Registro Compartilhado (SRS) da Verisign permite que um usuário final que registra domínios registre IDNs por meio de uma empresa de registro de domínio em qualquer script identificado no Unicode 5.2 e foi aprovado na especificação do Protocolo IDNA2008 (RFC 5891). Para acomodar scripts raros, notações musicais e outros caracteres especiais, a Verisign especificou pontos de código permitidos, restritos e proibidos em nossa Política para Pontos de Código IDN.

PRECISA DE MAIS INFORMAÇÕES?