NOMS DE DOMAINE INTERNATIONAUX (IDN)

Règles d'enregistrement

Le Système d'enregistrement partagé (SRS) Verisign permet de créer des IDN (noms de domaines internationalisés) qui contiennent différentes écritures Unicode.

Verisign a développé une politique pour les enregistrements d'IDN spécifiant les points de code autorisés, restreints et interdits. La politique est implémentée selon les cinq règles de validation suivantes. Les IDN qui respectent ces cinq règles sont considérés comme des enregistrements valides.

1. Normes IETF

La spécification IDNA2008 définit les règles et algorithmes qui autorisent/interdisent les points Unicode dans les enregistrements d'IDN. Verisign se conforme entièrement à tous les documents RFC qui composent la norme IDNA2008. Consultez les Normes de l'IETF.

2. Restrictions sur des langues spécifiques

Tous les enregistrements d'IDN nécessitent une balise de langue de 3 lettres. Par exemple CHI pour le chinois. Si la balise de langue associée à l'enregistrement se trouve dans le tableau suivant, cela signifie que Verisign possède une liste de tous les caractères inclus pour cette langue. L'IDN demandé doit être composé uniquement de caractères compris dans cette liste de caractères inclus. Si un seul point de code de l'IDN n'est pas un caractère valide pour cette langue, l'enregistrement est refusé.

Le tableau suivant répertorie les langues qui disposent d'une liste de caractères inclus.

BALISE DE LANGUE LANGUE
AZE Azéri
BEL Biélorusse
BUL Bulgare
CHI Chinois
GRE Grec
JPN Japonais
KOR Coréen
KUR Kurde
MAC Macédonien
MOL Moldave
POL Polonais
RUS Russe
SCC Serbe
SCR Croate
SRP Serbe
UKR Ukrainien

3. Restrictions sur l'amalgame des écritures

Si la balise de langue spécifiée pour l'enregistrement de l'IDN ne figure pas dans le tableau ci-dessus et ne dispose donc pas d'une liste de caractères inclus, Verisign applique alors une restriction alternative afin d'empêcher l'amalgame de différentes écritures dans un seul domaine.

La norme Unicode définit un jeu d'écritures Unicode en attribuant exactement une valeur d'écriture Unicode à chaque point de code. La règle veut que les registres Verisign refusent l'amalgame des points de code provenant de différentes écritures Unicode. C'est-à-dire que si un IDN contient des points de code provenant de plus d'une écriture Unicode, l'enregistrement de cet IDN est refusé. Par exemple, un caractère de l'écriture latine ne peut pas être utilisé avec des caractères de l'alphabet cyrillique dans un même IDN. Tous les points de code dans un IDN doivent provenir de la même écriture Unicode. Cela permet d'éviter la présence dans un IDN de points de code susceptibles d'être confondus.

Encore une fois, cette règle s'applique uniquement aux langues pour lesquelles il n'existe pas de liste de caractères inclus strictement définie. Par exemple, la balise de langue FRE, pour la langue française, n'a pas de liste de caractères inclus. La règle sur l'amalgame s'applique donc. Tous les points de code dans un domaine français doivent provenir de la même écriture. Mais cette écriture peut être n'importe laquelle des écritures définies Unicode valides.

Le tableau suivant répertorie les écritures Unicode et le tableau associé de points de code autorisés.

Écritures Unicode et points de code associés

Pour consulter une liste complète de tous les points Unicode autorisés pour l'enregistrement d'IDN, cliquez ici.

4. Points Unicode interdits de l'ICANN

Le système d'enregistrement partagé Verisign SRS adhère également aux Guidelines for the Implementation of Internationalized Domain Names de l'ICANN. La section 5 de ce document répertorie les caractères autorisés par la norme IETF, mais interdits pour l'enregistrement d'IDN. Pour cette raison, le système d'enregistrement partagé Verisign SRS interdit les points de code Unicode suivants dans tous les enregistrements. Vous trouverez une liste complète des points Unicode interdits de l'ICANN ici.

5. Caractères spéciaux

Il existe exactement deux (2) caractères Unicode dont la définition la plus récente n'est pas rétro compatible avec les versions précédentes de la norme IDNA. La lettre eszett latine et le Sigma final grec étaient autrefois mappés à d'autres caractères. Les clients et registres conformes à l'ancienne norme mappent par exemple la lettre eszett latine en deux « s » minuscules latins. Ce mappage est irréversible. La dernière version de la norme IDNA n'applique pas ce mappage. Par conséquent, si la lettre eszett latine était autrefois interdite (mappée en d'autres caractères), la norme la plus récente autorise les registres à accepter ce caractère à leur seule discrétion.

Ces modifications n'étant pas rétro compatibles, Verisign a donc choisi de continuer à interdire ces deux (2) caractères en attendant qu'une approche claire et précise de leur enregistrement ait été trouvée et communiquée.

CARACTÈRE POINT UNICODE GLYPHE
Lettre eszett minuscule latine U+00DF ß
Sigma final minuscule U+03C2 ς