VARIANTI DI CARATTERI

Verisign ha collaborato con i soggetti interessati per risolvere il problema legato alle varianti di caratteri. In genere, i registranti registrano nomi di dominio che hanno un significato compiuto nella propria lingua, come nomi, parole o frasi. Tuttavia, un unico alfabeto può essere utilizzato da più di una lingua.


Di conseguenza, un nome di dominio potrebbe avere diversi significati nel contesto di altre lingue o culture. Questo fenomeno include quattro tipi diversi di varianti: variante di carattere, ortografica, lessicale e contestuale. Verisign ha evidenziato che la creazione di varianti di carattere mirate sono essenziali per consentire agli utenti di navigare in Internet nella propria lingua. Altri tipi di varianti implicano valutazioni linguistiche complesse, non essenziali per garantire una soluzione IDN valida.

VARIANTI DI CARATTERI CINESI

Numerose lingue possono avere varianti di caratteri potenzialmente in grado di confondere l'utente finale. Ad esempio, la lingua cinese ha due forme scritte: il cinese semplificato, utilizzato principalmente nella Cina continentale, e il cinese tradizionale, utilizzato soprattutto a Taiwan, Hong Kong e altri paesi del Sud-Est asiatico. Le due forme scritte hanno diversi caratteri in comune, tuttavia i caratteri cinesi semplificati possono avere lo stesso significato dei caratteri complessi del cinese tradizionale. Questi caratteri, noti come varianti, hanno lo stesso significato e la stessa pronuncia, ma non lo stesso aspetto.

UNA SOLUZIONE PER LE VARIANTI DI CARATTERI

Diversi esperti tecnici della community hanno proposto diversi approcci al problema delle varianti di caratteri. Ciascun approccio porta con sé aspetti positivi e negativi. Tuttavia, la community IDN conviene sul fatto che il problema delle varianti di caratteri non potrà mai essere risolto del tutto, poiché le lingue sono in costante evoluzione. Nuove varianti di caratteri continueranno ad essere introdotte nelle varie lingue. Per cercare di risolvere il problema delle varianti di caratteri, Verisign ha adottato tag linguistici che rimandano a tabelle di lingue.

A tale scopo, Verisign collabora con diversi soggetti interessati, tra cui China Network Information Center (CNNIC) (.cn), Taiwan Network Information Center (TWNIC) (.tw), National Internet Development Agency of Korea (.kr), Japan Registry Service (JPRS) (.jp), il Chinese Domain Name Consortium (CDNC) e l'IDN Implementation Committee fondato da ICANN.

TAG LINGUISTICI

L'infrastruttura IDN di Verisign è conforme alle linee guida dell'ICANN Registry Implementation Committee (RIC) e prevede che ciascun IDN sia associato a una lingua specifica mediante un "tag linguistico". Il registrante seleziona il tag linguistico dell'IDN durante la procedura di registrazione. Se un IDN combina più lingue, il registrante deve selezionare la lingua adeguata. Oggi non tutti i tag linguistici vengono citati, ma tramite l'acquisizione delle informazioni in fase di registrazione, sarà possibile adottare le tabelle di lingue in futuro. È possibile scaricare l'elenco Verisign Valid Language Tags (PDF).

TABELLE DI LINGUE

Quando è necessaria la registrazione di un IDN, il tag linguistico viene controllato in base a un elenco di lingue che hanno tabelle di inclusione dei caratteri o tabelle di mappatura delle varianti di caratteri. Le tabelle vengono applicate ai punti di codice Unicode che costituiscono una registrazione per determinare se questa sia valida per una lingua specifica. Se la registrazione non va a buon fine per una lingua, il set di caratteri può ancora essere disponibile con un tag linguistico diverso.

Tabelle di lingue distribuite nella soluzione per le varianti di caratteri Verisign

LINGUAPunti di codice
Cinese
Giapponese
PolaccoSolo caratteri latini
GrecoU+002D, U+0030 tramite U+0039, U+0370 tramite U+03FF
RussoU+002D, U+0030 tramite U+0039, U+0400 tramite U+04FF, U+0500 tramite U+052F
BielorussoU+002D, U+0030 tramite U+0039, U+0400 tramite U+04FF, U+0500 tramite U+052F
UcrainoU+002D, U+0030 tramite U+0039, U+0400 tramite U+04FF, U+0500 tramite U+052F
SerboU+002D, U+0030 tramite U+0039, U+0400 tramite U+04FF, U+0500 tramite U+052F
MacedoneU+002D, U+0030 tramite U+0039, U+0400 tramite U+04FF, U+0500 tramite U+052F
BulgaroU+002D, U+0030 tramite U+0039, U+0400 tramite U+04FF, U+0500 tramite U+052F

PUNTI DI CODICE IDN

Il sistema Shared Registration System (SRS) di Verisign consente a un registrante di registrare IDN tramite una società di registrazione in qualsiasi script identificato nell'ambito di Unicode 5.2 e passato attraverso la specifica di protocollo IDNA2008 (RFC 5891). Per accettare alfabeti rari, notazioni musicali e altri caratteri speciali, Verisign ha specificato punti di codice consentiti, limitati e proibiti nelle policy per i punti di codice IDN.