Scripts en talen

IDN's (Internationalized Domain Names) zijn domeinnamen of webadressen op het tweede of derde niveau die zijn geregistreerd in een tekenset of script die in Unicode zijn gedefinieerd.


Voor een beter begrip van de manier waarop Verisign-IDN's ondersteuning bieden voor domeinregistratie in honderden native-talen met één SRS (Gedeeld registratiesysteem), moet u begrijpen hoe tekens en scripts worden gebruikt in geschreven taal en worden vertaald voor computers.

RELATIE TUSSEN SCRIPT, TEKEN EN TAAL

SCRIPTLatijnArabischhanGrieks
TEKENLس漢字Ω
TaalNederlandsFarsiChineesGrieks

SCRIPT

Een script is een verzameling symbolen die worden gebruikt om tekstgegevens in een taal weer te geven. Voorbeelden van scripts: Latijn, Arabisch, Han, Grieks.

TEKEN

Een teken vormt de basisbouwsteen van elk script en dus van elke geschreven taal. Een teken draagt betekenis op elementair niveau. Het is niet mogelijk een teken verder op te splitsen zonder betekenisverlies.

GESCHREVEN TAAL

Een geschreven taal gebruikt tekens uit een of meer scripts om een boodschap over te dragen. Voorbeelden van talen: Engels, Farsi, Chinees, Grieks.

TALEN AANPASSEN AAN COMPUTERS

Verschillende scripts gebruiken verschillende toetsenborden of schermtoetsenborden om tekst in computers in te voeren. Besturingssystemen van computers maken gebruik van IME's (Input Method Editors) om de invoer van verschillende scripts te vereenvoudigen. IDN's zijn een soortgelijke aanpassing en hiermee kunnen gebruikers het script van hun lokale taal gebruiken om over het web te surfen, e-mail te versturen en ontvangen, bestanden over te dragen en andere toepassingen te gebruiken waarvoor domeinnamen zijn vereist.

UNICODE

Een computer maakt gebruik van tekencodering om deze tekens te begrijpen. Elk teken in een tekenset krijgt een uniek nummer toegewezen. Zo krijgt een hoofdletter A in de ASCII-tekenset het nummer 65. De meeste domeinnamen zijn geregistreerd in ASCII-tekens (A t/m Z, 0 t/m 9 en het streepje '-'). Niet-Engelse woorden met diakritische tekens (accenten) zoals in het Spaans en het Frans, en talen die niet-Latijnse scripts gebruiken, zoals Kanji en Arabisch, kunnen echter niet worden weergegeven in ASCII. Unicode is een universele gecodeerde tekenset die 350 verschillende native-talen beslaat; Daarom maken IDN's gebruik van Unicode.

TAALCODES

De Verisign IDN-infrastructuur voldoet aan de richtlijnen van het ICANN Registry Implementation Committee (RIC) en vereist dat elke IDN met behulp van een 'taalcode' aan een specifieke taal wordt gekoppeld. De inschrijver selecteert de IDN-taalcode tijdens het registratieproces. Als een IDN meer dan een taal combineert, moet de inschrijver de meest relevante taal selecteren. (Momenteel wordt niet naar alle taalcodes verwezen, maar door de gegevens tijdens het registratieproces vast te leggen, kunnen taaltabellen in de toekomst worden aangepast.) Download de pdf-lijst van Geldige Taalcodes Verisign

TAALTABELLEN

Wanneer om een IDN-registratie wordt gevraagd, wordt de taalcode gecontroleerd aan de hand van een lijst met talen die tabellen voor tekeninsluiting of toewijzing van tekenvarianten hebben. Deze tabellen worden toegepast op de Unicode-codepunten die een registratie vormen en bepalen of de registratie geldig is voor een specifieke taal. Als een registratie in een bepaalde taal mislukt, is de tekenset mogelijk nog steeds beschikbaar met een andere taalcode.

WILT U MEER INFORMATIE?