TEKENVARIANTEN

Verisign heeft zich ingespannen om het probleem van tekenvarianten met de relevante betrokkenen aan te pakken. Inschrijvers registreren meestal domeinnamen die iets betekenen in hun eigen taal, zoals een naam, woord of zin. Eén script kan echter door meer dan een taal worden gebruikt.


Daarom kan een domeinnaam verschillende betekenissen hebben in de context van andere talen of culturen. De variant is in vier verschillende categorieën onderverdeeld: tekens, spelling, lexemen en contexten. Verisign heeft bepaald dat het verwerken van tekenvarianten essentieel is om gebruikers in staat te stellen in hun eigen taal op het internet te surfen. De andere varianten vereisen lastige, linguïstieke beslissingen die niet essentieel zijn voor het leveren van een robuuste IDN-oplossing.

CHINESE TEKENVARIANTEN

Vele talen kunnen tekenvarianten hebben die verwarring bij de eindgebruiker zouden kunnen veroorzaken. Zo heeft de Chinese taal twee geschreven vormen: Vereenvoudigd Chinees, voornamelijk gebruikt op het vasteland van China, en Traditioneel Chinees, dat hoofdzakelijk in Taiwan, Hongkong en andere Zuidoost-Aziatische landen wordt gebruikt. De twee geschreven vormen delen vele tekens. Vereenvoudigde tekens in Vereenvoudigd Chinees kunnen echter dezelfde betekenis hebben als complexe tekens in Traditioneel Chinees. Deze tekens, tekenvarianten genoemd, betekenen hetzelfde en worden hetzelfde uitgesproken, maar ze zien er niet hetzelfde uit.

EEN OPLOSSING VOOR TEKENVARIANTEN

Verschillende 'thought leaders' in de technische gemeenschap hebben verschillende benaderingen voorgesteld om het probleem met tekenvarianten aan te pakken. Elke benadering heeft positieve en negatieve aspecten. De ISDN-gemeenschap is het er echter over eens dat dit probleem waarschijnlijk nooit helemaal zal worden opgelost, omdat talen continu veranderen. Er zullen steeds nieuwe tekenvarianten worden geïntroduceerd in en tussen verschillende talen. Verisign gebruikt taalcodes die naar taaltabellen verwijzen om het probleem met tekenvarianten aan te pakken.

Om het probleem van taalvarianten aan te pakken heeft Verisign samengewerkt met geïnteresseerde belanghebbenden, waaronder China Network Information Center (CNNIC) (.cn), Taiwan Network Information Center (TWNIC) (.tw), National Internet Development Agency of Korea (.kr), Japan Registry Service (JPRS) (.jp), het Chinese DomeinNaam Consortium (CDNC) en het IDN Implementation Committee opgericht door ICANN.

TAALCODES

De Verisign IDN-infrastructuur voldoet aan de richtlijnen van het ICANN Registry Implementation Committee (RIC) en vereist dat elke IDN met behulp van een 'taalcode' aan een specifieke taal wordt gekoppeld. De inschrijver selecteert de IDN-taalcode tijdens het registratieproces. Als een IDN meer dan een taal combineert, moet de inschrijver de meest relevante taal selecteren. (Momenteel wordt niet naar alle taalcodes verwezen, maar door de gegevens tijdens het registratieproces vast te leggen, kunnen taaltabellen in de toekomst worden aangepast.) Download de lijst met Geldige taalcodes Verisign (PDF).

TAALTABELLEN

Wanneer om een IDN-registratie wordt gevraagd, wordt de taalcode gecontroleerd aan de hand van een lijst met talen die tabellen voor tekeninsluiting of toewijzing van tekenvarianten hebben. Deze tabellen worden toegepast op de Unicode-codepunten die een registratie vormen en bepalen of de registratie geldig is voor een specifieke taal. Als een registratie in een bepaalde taal mislukt, is de tekenset mogelijk nog steeds beschikbaar met een andere taalcode.

Taaltabellen gebruikt in de Verisign-oplossing voor tekenvarianten

TAALCodepunten
Chinees
Japans
PoolsAlleen de Latijnse tekens
GrieksU+002D, U+0030 tot en met U+0039, U+0370 tot en met U+03FF
RussischU+002D, U+0030 tot en met U+0039, U+0400 tot en met U+04FF, U+0500 tot en met U+052F
Wit-RussischU+002D, U+0030 tot en met U+0039, U+0400 tot en met U+04FF, U+0500 tot en met U+052F
OekraïensU+002D, U+0030 tot en met U+0039, U+0400 tot en met U+04FF, U+0500 tot en met U+052F
ServischU+002D, U+0030 tot en met U+0039, U+0400 tot en met U+04FF, U+0500 tot en met U+052F
MacedonischU+002D, U+0030 tot en met U+0039, U+0400 tot en met U+04FF, U+0500 tot en met U+052F
BulgaarsU+002D, U+0030 tot en met U+0039, U+0400 tot en met U+04FF, U+0500 tot en met U+052F

IDN-CODEPUNTEN

Met behulp van het Verisign Shared Registration System (SRS) kan een inschrijver IDN's registreren via een registratiehouder in elk script dat binnen Unicode 5.2 is geïdentificeerd en waarvoor de IDNA2008 Protocolspecificatie (RFC 5891) is uitgevoerd. Om rekening te houden met ongewone alfabetten, muzieknotaties en andere speciale tekens, heeft Verisign toegestane, beperkte en verboden codepunten gespecificeerd in het Beleid voor IDN-codepunten.

WILT U MEER INFORMATIE?