Zeichenvarianten

Verisign hat im Interesse der Beteiligten an der Lösung des Zeichenvariantenproblem gearbeitet. Registranten registrieren i.d.R. Domainnamen, die eine Bedeutung in ihrer Sprache haben (ein Name, ein Wort oder eine Wortfolge). Bestimmte Schriften werden jedoch von mehreren Sprachen genutzt.


Daher kann ein Domainname in anderen Sprachen oder Kulturen eine andere Bedeutung haben. Die möglichen Varianten sind in vier Kategorien eingeteilt: Zeichen, Orthografie, Lexemik und Kontext. Verisign ist der Meinung, dass Zeichenvarianten berücksichtigt werden müssen, damit Benutzer das Internet in ihrer Muttersprache nutzen können. Die anderen Varianten erfordern schwierige linguistische Entscheidungen, die für die Bereitstellung einer robusten IDN-Lösung nicht wichtig sind.

Chinesische Zeichenvarianten

In vielen Sprachen existieren Zeichenvarianten, die bei den Endbenutzern potenziell zu Verwechslungen führen könnten. Beispiel: Es gibt zwei chinesische Schriftsprachen – die vereinfachte Form, die überwiegend auf dem Festland verwendet wird, und die traditionelle Form, die überwiegend in Taiwan, Hongkong und anderen südostasiatischen Ländern verwendet wird. Zwar haben die beiden Schriftsprachen viele gemeinsame Zeichen, doch können vereinfachte Zeichen im vereinfachten Chinesisch dieselbe Bedeutung haben wie komplexe Zeichen im traditionellen. Diese Zeichen werden Zeichenvarianten genannt und haben dieselbe Bedeutung und Aussprache, sehen aber unterschiedlich aus.

Eine Lösung für Zeichenvarianten

Verschiedene Experten auf dem Gebiet haben verschiedene Lösungsmöglichkeiten für das Problem der Zeichenvarianten vorgeschlagen. Jeder Vorschlag hat Vor- und Nachteile. Die IDN-Gemeinschaft ist sich jedoch einig, dass das Problem der Zeichenvarianten niemals umfassend gelöst werden kann, da sich Sprachen ständig verändern. Neue Zeichenvarianten werden immer wieder zwischen bestimmten Sprachen auftauchen. Verisign nutzt Sprach-Tags, die sich auf Sprachtabellen beziehen, um das Problem mit Zeichenvarianten zu umgehen.

Verisign hat dabei mit interessierten Parteien (z.B. China Network Information Center (CNNIC) (.cn), Taiwan Network Information Center (TWNIC) (.tw), National Internet Development Agency of Korea (.kr), Japan Registry Service (JPRS) (.jp), Chinese Domain Name Consortium (CDNC) und dem von ICANN in die Welt gerufenen IDN Implementation Committee) zusammengearbeitet.

Sprach-Tags

Die IDN-Infrastruktur von Verisign entspricht den Richtlinien des ICANN Registry Implementation Committee (RIC) und erfordert, dass jeder IDN unter Verwendung eines "Sprach-Tags" mit einer bestimmten Sprache verknüpft wird. Der Registrant wählt das IDN-Sprach-Tag während der Registrierung aus. Wenn ein IDN mehrere Sprachen kombiniert, muss der Registrant die bestgeeignete Sprache wählen. (Es werden heute nicht alle Sprach-Tags referenziert. Das Erfassen der Informationen während der Registrierung ermöglicht jedoch die zukünftige Nutzung von Sprachtabellen. Laden Sie die Liste Verisign Valid Language Tags (PDF) herunter.

Sprachtabellen

Wenn eine IDN-Registrierung angefordert wird, wird das Sprach-Tag mit einer Liste von Sprachen verglichen, für die Zeicheneinschlusstabellen oder Zeichenvariantenzuordnungstabellen vorhanden sind. Diese Tabellen werden auf die Unicode-Codepunkte der Registrierung angewendet, um festzulegen, ob die Registrierung für eine bestimmte Sprache gültig ist. Schlägt eine Registrierung für eine Sprache fehl, ist der Zeichensatz eventuell trotzdem mit einem anderen Sprach-Tag verfügbar.

In der Verisign Character Variant Solution verfügbare Sprachtabellen

SpracheCodepunkte
Chinesisch
Japanisch
PolnischNur lateinische Buchstaben
GriechischU+002D, U+0030 bis U+0039, U+0370 bis U+03FF
RussischU+002D, U+0030 bis U+0039, U+0400 bis U+04FF, U+0500 bis U+052F
WeißrussischU+002D, U+0030 bis U+0039, U+0400 bis U+04FF, U+0500 bis U+052F
UkrainischU+002D, U+0030 bis U+0039, U+0400 bis U+04FF, U+0500 bis U+052F
SerbischU+002D, U+0030 bis U+0039, U+0400 bis U+04FF, U+0500 bis U+052F
MazedonischU+002D, U+0030 bis U+0039, U+0400 bis U+04FF, U+0500 bis U+052F
BulgarischU+002D, U+0030 bis U+0039, U+0400 bis U+04FF, U+0500 bis U+052F

IDN-Codepunkte

Das Verisign Shared Registration System (SRS) ermöglicht dem Registranten, IDN über einen Registrar in einer beliebigen Schrift zu registrieren, die in Unicode 5.2 definiert und nach IDNA2008-Protokoll zugelassen ist. Damit seltene Schriften, Notensätze und andere Sonderzeichen genutzt werden können, hat Verisign zulässige, eingeschränkte und unzulässige Codepunkte in der Richtlinie für IDN-Codepunkte definiert.

BENÖTIGEN SIE WEITERE INFORMATIONEN?