Grafie e lingue

Per IDN (nomi di dominio internazionalizzati) si intendono nomi di dominio di secondo o terzo livello, oppure indirizzi Web registrati in vari set di caratteri o grafie definite in Unicode.


Per comprendere come gli IDN Verisign supportano la registrazione dei nomi di dominio in centinaia di lingue d'origine con un solo Shared Registration System (SRS; sistema di registrazione condiviso), è necessario capire come vengono utilizzati caratteri e alfabeti nella lingua scritta e come vengono tradotti in ambito informatico.

RELAZIONE TRA ALFABETO, CARATTERE E LINGUA

SCRIPTLatinoArabohanGreco
CARATTERELس漢字Ω
LinguaIngleseFarsiCineseGreco

SCRIPT

Un alfabeto è un insieme di simboli utilizzati per rappresentare informazioni testuali in una lingua. Esempi di alfabeti: latino, arabo, han, greco.

CARATTERE

Per carattere si intende l'unità di base di ogni alfabeto e, quindi, di ogni lingua scritta. In qualità di livello di base, a tale unità corrisponde un significato. Non è possibile suddividere ulteriormente un carattere e farvi corrispondere un significato.

LINGUA SCRITTA

Una lingua scritta utilizza caratteri appartenenti a uno o più alfabeti per comunicare dei significati. Esempi di lingue: inglese, farsi, cinese, greco.

ADATTAMENTO DELLE LINGUE AI COMPUTER

I diversi alfabeti richiedono l'impiego di diversi tipi di tastiere o tastiere a video per inserire informazioni nei dispositivi di elaborazione. I sistemi operativi utilizzano editor IME (Input Method Editors) che semplificano l'inserimento di diversi tipi di alfabeti. Gli IDN sono tipologie di adattamento simili che consentono di utilizzare gli alfabeti della lingua locale per navigare il Web, inviare e ricevere e-mail, trasferire file ed eseguire ulteriori attività che richiedono nomi di dominio.

UNICODE

Un computer utilizza una codifica di caratteri per la loro interpretazione. Ad ogni carattere che fa parte di un insieme viene associato un numero univoco. Ad esempio, nell'insieme di caratteri con codifica ASCII, alla lettera maiuscola "A" corrisponde il numero 65. La maggior parte dei nomi di dominio è registrata con caratteri ASCII (dalla A alla Z, da 0 a 9 e il trattino "-"). Tuttavia, le parole non inglesi che richiedono segni diacritici, ad esempio in francese e spagnolo, e le lingue che utilizzano grafie con caratteri non derivanti dal latino, quali kanji e arabo, non possono essere visualizzate in ASCII. Unicode, invece, è un insieme universale di caratteri codificati che include ben 350 lingue native differenti. Per questo motivo, il sistema IDN utilizza Unicode.

TAG LINGUISTICI

L'infrastruttura IDN di Verisign è conforme alle linee guida dell'ICANN Registry Implementation Committee (RIC) e prevede che ciascun IDN sia associato a una lingua specifica mediante un “tag di lingua". Il registrante seleziona il tag di lingua dell'IDN durante la procedura di registrazione. Se un IDN combina più lingue, il registrante deve selezionare la lingua adeguata. (Oggi non tutti i tag di lingua vengono citati, ma tramite l'acquisizione delle informazioni in fase di registrazione, sarà possibile adottare le tabelle lingua in futuro.) Scarica l'elenco di PDF dei tag linguistici validi di Verisign

TABELLE LINGUISTICHE

Quando è necessaria la registrazione di un IDN, il tag linguistico viene controllato in base a un elenco di lingue che hanno tabelle di inclusione dei caratteri o tabelle di mappatura delle varianti di caratteri. Le tabelle vengono applicate ai punti di codice Unicode che costituiscono una registrazione per determinare se questa sia valida per una lingua specifica. Se la registrazione non va a buon fine per una lingua, il set di caratteri può ancora essere disponibile con un tag linguistico diverso.