INTERNATIONALISIERTE DOMAINNAMEN (IDNS)

Registrierungsregeln

Das Verisign Shared Registration System (SRS) unterstützt Internationalized Domain Names (IDN), die Zeichen verschiedener Unicode-Schriften enthalten.

Verisign hat eine Richtlinie für IDN-Registrierungen entwickelt, die zulässige und unzulässige Codepunkte definiert. Die Richtlinie ist in den folgenden fünf Validierungsregeln implementiert. IDN, bei denen diese fünf Regeln berücksichtigt sind, gelten als gültige Registrierungen.

1. IETF-Standards

Die IDNA2008-Vorschrift definiert Regeln und Algorithmen, die Unicode-Punkte in IDN-Registrierungen zulassen bzw. verbieten. Verisign befindet sich in voller Übereinstimmung mit allen RFC-Dokumenten, die die Vorschrift IDNA2008 enthalten. Bitte lesen Sie die IETF-Vorschriften.

2. Einschränkungen für bestimmte Sprachen

Alle IDN-Registrierungen erfordern einen dreistelligen Sprach-Tag. CHI beispielsweise steht für die chinesische Sprache. Ist der zu einer Registrierung gehörende Sprach-Tag in folgender Tabelle enthalten, verfügt Verisign über eine Liste enthaltener Zeichen für die entsprechende Sprache. Der angeforderte IDN muss vollständig auf der Liste der enthaltenen Zeichen zu finden sein. Ist auch nur ein Codepunkt des IDN kein gültiges Zeichen für die jeweilige Sprache, wird die Registrierung abgelehnt.

Die folgende Tabelle enthält die Sprachen, für die eine Liste enthaltener Zeichen existiert.

Sprach-Tag Sprache
AZE Aserbaidschanisch
BEL Weißrussisch
BUL Bulgarisch
CHI Chinesisch
GRE Griechisch
JPN Japanisch
KOR Koreanisch
KUR Kurdisch
MAC Mazedonisch
MOL Moldawisch
POL Polnisch
RUS Russisch
SCC Serbisch
SCR Kroatisch
SRP Serbisch
UKR Ukrainisch

3. Einschränkungen beim Mischen von Schriften

Steht der bei der IDN-Registrierung angegebene Sprach-Tag nicht in der obigen Tabelle, sodass für ihn keine Liste enthaltener Zeichen existiert, wendet Verisign eine alternative Einschränkung an, um das Mischen verschiedener Schriften in einer einzigen Domain zu verhindern.

Der Unicode-Standard definiert eine Reihe von Unicode-Schriften, indem er jedem Unicode-Datenpunkt genau einen Unicode-Schriftwert zuordnet. In der Regel lehnen Verisign-Registrys das Mischen von Codepunkten aus verschiedenen Unicode-Schriften ab. Das heißt, wenn ein IDN Codepunkte aus zwei oder mehr Unicode-Schriften enthält, wird diese IDN-Registrierung abgelehnt. Beispiel: Ein Buchstabe aus dem lateinischen Alphabet kann nicht in demselben IDN wie ein kyrillischer Buchstabe verwendet werden. Alle Codepunkte innerhalb eines IDN müssen aus derselben Unicode-Schrift stammen. Auf diese Weise wird verhindert, dass verwechselbare Codepunkte im selben IDN auftauchen.

Diese Regel gilt ebenfalls für Sprachen, für die keine eindeutig definierte Liste enthaltener Zeichen existiert. So gibt es beispielsweise für den Sprach-Tag FRE, also die französische Sprache, keine genaue Liste der enthaltenen Zeichen und damit gilt die Vermischungsregel. Alle Codepunkte in einer französischen Domain müssen aus derselben Schrift stammen. Diese Schrift kann jedoch eine beliebige der gültigen Unicode-definierten Schriften sein.

Die folgende Tabelle enthält Unicode-Schriften sowie die zugehörige Tabelle der zulässigen Codepunkte.

Unicode-Schriften und zugehörige Codepunkte

Eine umfassende Liste aller für IDN-Registrierungen zulässigen Unicode-Punkte erhalten Sie, indem Sie hier klicken.

4. ICANN Einschränkungen der Unicode-Punkte

Das Verisign SRS stimmt außerdem mit den ICANN-Richtlinien für die Implementierung von Internationalized Domain Names überein. Abschnitt 5 des Dokuments enthält Zeichen, die der IETF-Standard zulässt, die jedoch bei der IDN-Registrierung nicht zulässig sein dürfen. Aus diesem Grund verbietet das Verisign SRS die folgenden Unicode-Codepunkte bei allen Registrierungen. Eine vollständige Liste der ICANN-Einschränkungen für Unicode-Punkte finden Sie hier.

5. Sonderzeichen

Es existieren genau zwei (2) Unicode-Zeichen, deren neueste Definitionen nicht mit früheren Versionen des IDNA-Standards rückwärts kompatibel sind. Das lateinische scharfe S und das griechische End-Sigma wurden früher durch andere Zeichen dargestellt. So würden Clients und Registrys das lateinische scharfe S nach älteren Standards beispielsweise durch zwei kleine lateinische ss darstellen. Diese Darstellung ist irreversibel. Die neueste Version des IDNA-Standards wendet diese Darstellungsweise nicht an. So stellt der neueste Standard den Registrys beispielsweise frei, das lateinische scharfe S zu verwenden, während es früher nicht zulässig war (durch andere Zeichen dargestellt wurde).

Da diese Änderungen nicht rückwärts kompatibel sind, hat Verisign sich dafür entschieden, diese beiden (2) Zeichen auch künftig solange nicht zuzulassen, bis eine eindeutige und angemessene Lösung für deren Registrierung erzielt und publiziert wird.

Zeichen Unicode-Punkt Glyphe
Latin Small Letter Sharp S U+00DF ß
Greek Small Letter Final Sigma U+03C2 ς