Scripts + Linguagens

Os Internationalized Domain Names (Nomes de domínio internacionalizados) (IDNs) são nomes de domínio de segundo ou terceiro nível, ou endereços da Web registrados em qualquer conjunto de caracteres ou script definido em Unicode.


Para entender como os IDNs da Verisign são compatíveis com o registro de nomes em centenas de idiomas nativos através de um único Sistema de Registro Compartilhado (SRS), é preciso entender como os caracteres e scripts são usados em linguagem escrita e convertidos para computação.

RELAÇÃO ENTRE SCRIPT, CARACTERE E IDIOMAS

SCRIPTLatimÁrabehanGrego
CARACTERELس漢字Ω
IdiomaInglêsPersaChinêsGrego

SCRIPT

Um script é um conjunto de símbolos usado para representar informações textuais em um idioma. Exemplos de scripts: latim, árabe, han, grego.

CARACTERE

Um caractere é o bloco constitutivo básico de qualquer script e, portanto, de qualquer língua escrita. Ele evoca um significado em um nível fundamental; não é possível dividir um caractere ainda mais e ter um significado mesmo assim.

IDIOMA ESCRITO

Um idioma escrito utiliza caracteres de um ou mais scripts para comunicar sentidos. Exemplos de idiomas: inglês, persa, chinês, grego.

ADAPTANDO IDIOMAS A COMPUTADORES

Scripts diferentes usam teclados ou teclados virtuais diferentes para a entrada de dados em dispositivos computacionais. Os sistemas operacionais têm Editores de métodos de entrada (IME) que facilitam a entrada de dados de diferentes scripts. Os IDNs são tipos similares de adaptações, permitindo que as pessoas usem seus scripts no idioma local para navegar na Internet, mandar e receber e-mails, transferir arquivos e outros aplicações que exigem nomes de domínio.

UNICODE

Um computador usa codificação de caracteres para entendê-los. A cada caractere em um conjunto de caracteres é atribuído um número único. Por exemplo, no conjunto de caracteres com codificação ASCII, à caixa alta "A" é atribuído o numero 65. A maioria dos nomes de domínio é registrada em caracteres ASCII (A a Z, 0 a 9 e hífen “-“). No entanto, palavras não inglesas que requerem diacríticos, como espanhol ou francês, e idiomas que usam scripts não latinos, como kanji e árabe, não podem ser exibidas em ASCII. O Unicode é um conjunto universal de caracteres codificados, o qual abrange 350 idiomas nativos diferentes. Por esse motivo, os IDNs usam Unicode.

TAGS DE IDIOMA

A infraestrutura IDN da Verisign está em conformidade com o ICANN Registry Implementation Committee (RIC) e requer que cada Nome de Domínio Internacionalizado (IDN) esteja associado a um idioma específico usando uma "tag de idioma". O solicitante do registro seleciona a tag de idioma do IDN durante o processo de registro. Se um IDN combinar mais de um idioma, a entidade que está fazendo o registro deverá selecionar o idioma mais apropriado. (Nem todas as tags de idioma são referenciadas hoje; no entanto, capturar as informações durante o processo de registro permite a adoção de tabelas de idiomas no futuro.) Faça download das tags de idiomas válidas da Verisign (PDF)

TABELAS DE IDIOMAS

Quando um registro de IDN é solicitado, a guia de idioma é verificada com relação a uma lista de idiomas que tenham tabelas de inclusão de caracteres ou tabelas de mapeamento de variação de caracteres. Essas tabelas são aplicadas aos pontos Unicode que compõem um registro para determinar se o registro é válido para um idioma específico. Se o registro falhar para um idioma, o conjunto de caracteres ainda poderá estar disponível com uma tag de idioma diferente.

PRECISA DE MAIS INFORMAÇÕES?