Scripts + Langues

Les noms de domaines internationalisés (IDN) sont des noms de domaines de deuxième ou troisième niveau ou des adresses Web, enregistrés dans un jeu de caractères ou une écriture quelconque, défini dans Unicode.


Il convient de savoir comment les caractères et les écritures sont utilisés en langue écrite et traduits pour l'informatique pour comprendre comment les IDN Verisign prennent en charge l'enregistrement de noms de domaines dans des centaines de langues avec un système d'enregistrement partagé (SRS) unique.

RELATIONS ENTRE ÉCRITURE, CARACTÈRES ET LANGUES

ÉCRITURELatinArabehanGrec
CARACTÈRELس漢字Ω
LangueAnglaisFarsiChinoisGrec

ÉCRITURE

Une écriture est un ensemble de symboles utilisés pour représenter des informations textuelles dans une langue. Exemples d'écritures : latin, arabe, hân, grec.

CARACTÈRE

Un caractère est l'élément constitutif de base de toute écriture et donc de tout langage écrit. Il est porteur de sens au niveau fondamental ; il n'est pas possible de diviser davantage un caractère sans le dénuer de sens.

LANGUE ÉCRITE

Une langue écrite utilise des caractères provenant d'une ou plusieurs écritures afin de communiquer du sens. Exemples de langues : anglais, farsi, chinois, grec.

ADAPTER LES LANGUES AUX ORDINATEURS

Différentes écritures utilisent différents claviers ou claviers matériels ou logiciels pour la saisie informatique. Les systèmes d'exploitation informatiques disposent d'éditeurs de méthode d'entrée qui facilitent la saisie de différents caractères. Les IDN sont dotés d'un type d'adaptation similaire, permettant aux utilisateurs de parcourir le Web, d'envoyer et de recevoir des courriers électroniques, de transférer des fichiers et d'utiliser toute autre application nécessitant des noms de domaines dans leur langue locale.

UNICODE

Un ordinateur utilise le codage de caractères pour les comprendre. Chaque caractère appartenant à un jeu de caractères est doté d'un numéro unique. Par exemple, dans le jeu de caractères codés ASCII, la lettre majuscule « A » porte le numéro 65. La majorité des noms de domaine sont enregistrés avec des caractères ASCII (lettres de A à Z, chiffres de 0 à 9, ainsi que le trait d'union "-"). Toutefois, les signes diacritiques, utilisés par exemple pour écrire en français ou en espagnol, et les alphabets ou systèmes d'écriture non latins, tels que ceux de l'arabe et du japonais, ne peuvent pas être reproduits en ASCII. Unicode est un jeu de caractères universels codés qui concerne environ 350 langues différentes. Les IDN utilisent Unicode pour cette raison.

BALISES DE LANGUE

L'infrastructure IDN de Verisign se conforme aux directives du Comité d'implémentation de registre (RIC) de l'ICANN et exige que chaque IDN soit associé à une langue spécifique à l'aide d'une « balise de langue ». L'inscrivant sélectionne la balise de langue IDN lors du processus d'enregistrement. Si un IDN comprend plusieurs langues, l'inscrivant doit sélectionner la langue qui convient le mieux. (Toutes les balises de langue ne sont pas référencées aujourd'hui ; toutefois, la saisie des informations lors du processus d'enregistrement permet l'adoption ultérieure des tables linguistiques.) Téléchargez la liste des balises de langue valides de Verisign au format PDF

TABLES LINGUISTIQUES

Lorsqu'un enregistrement d'IDN est demandé, la balise de langue est vérifiée par rapport à une liste de langues qui possèdent des tables d'inclusion de caractères ou des tables de mappage de variantes de caractères. Ces tables sont appliquées aux points Unicode qui constituent un enregistrement afin de déterminer si l'enregistrement est valide pour une langue spécifique. Dans le cas où l'enregistrement échoue pour une langue donnée, le jeu de caractères peut éventuellement être disponible avec une balise de langue différente.