Channel-Ressourcen

Internationalized Domain Names

Erkennen Sie die Ausdrucksstärke von .com und .net in lokalen Sprachen

Öffnen Sie eine Welt der Gelegenheiten mit neuen Kunden, neuen Registrierungen und weiteren Webdienstleistungen.

Verisign Internationalized Domain Names (IDNs) ermöglichen Unternehmen, .com und. net in lokalen Sprachzeichen darzustellen. Es ist eine freundlichere und sinnvollere Methode, um sich mit Kunden zu verbinden.

Die IDN-Geschichte

1996 befanden sich ungefähr zwei Drittel aller Internetbenutzer in den USA, so dass englische oder lateinische Zeichen (auch als ASCII-Zeichen bekannt) für die meisten aktiven Benutzer online ausreichten. Gemäß dem Bericht „State of the Global and Local Internet Comscore 2012“ ist seitdem jedoch die nicht-englischsprachige Internetgemeinde auf 87 Prozent angewachsen. Die Asien-Pazifik-Region macht 41,1 Prozent der Internetbenutzer weltweit aus.

Ursprünglich unterstützten Domains nur ASCII-Zeichen (A bis Z, 0 bis 9 und den Bindestrich „-“), das bedeutete, dass nicht-englische Wörter, die diakritische (z. B. Akzente, Umlaute, Kürzezeichen, Punkte usw.) und andere sprachbasierte oder nicht-lateinische Zeichen (z. B. Hangul, Arabisch, Thai, vereinfachtes Chinesisch usw.) benötigten, nicht verwendet werden konnten, um im Internet zu navigieren.

Mit immer mehr Internetaktivität, die außerhalb westlicher Länder stattfindet, stellt die Einführung von nicht-lateinischen Zeichen einen Fortschritt für Registrare und ihre Kunden dar, die neue Marktchancen sowohl für regionale als auch für globale Registrare schafft, die mit ihren Unternehmen expandieren möchten.

2000 führte Verisign Internationale Domainnamen (IDN) auf dem Second Level (links vom Punkt) für .com und .net ein. Das bedeutete, dass Domainnamen wie as스타벅.com erstellt, registriert und gesucht werden konnten, um das Internet für Millionen von Benutzern zugänglicher und relevanter zu machen.

2012 hat Verisign einen Antrag auf die Betreibung von Registrys für neun Transliterationen von .com und drei von .net gestellt (rechts vom Punkt) (Link zu DRAW #2) im Rahmen der neuen generischen Top-Level-Domain (gTLD) von ICANN, so dass Verisign Unternehmen vollständige Domainnamen in lokalen Sprachzeichen bieten kann.

Verisigns vorgeschlagener Ansatz für diese neuen IDN gTLDs trägt zu einer umfassenden Endnutzererfahrung bei und bewahrt Kunden und Unternehmen davor, rein defensive Domainnamen in unseren TLDs zu registrieren. In der Praxis bedeutet Verisigns vorgeschlagener Ansatz, dass der Registrant eines Second-Level-Domainnamens in unserem IDN.IDN, IDN.com oder IDN.net (gemäß geltenden Rechtsschutzmechanismen) das alleinige Recht, jedoch nicht die Pflicht besitzt, den gleichen Second-Level-Namen in allen oder einigen unserer Top-Level-IDNs, einschließlich .com oder .net, sofern zutreffend, zu registrieren.

Um unseren Ansatz besser zu beschreiben, haben wir im Folgenden zwei Anwendungsfälle ermittelt:

Anwendungsfall Nummer 1: Bob Smith besitzt bereits eine Registrierung für einen IDN.net-Second-Level-Domainnamen. Dieser Second-Level-Domainname wird in allen neuen .net TLDs nur für Bob Smith verfügbar sein. Bob Smith kann sich entscheiden, diesen Second-Level-Domainnamen nicht in einer der neuen Transliterationen der .net TLDs zu registrieren.

Anwendungsfall Nummer 2: John Doe besitzt keine Registrierung für einen IDN.com-Second-Level-Domainnamen. John Doe registriert einen Second-Level-Domainnamen in unserer Thai-Transliteration von .com, doch in keiner anderen TLD. Dieser Second-Level-Domainname wird in allen anderen Transliterationen von .com IDN TLDs und im .com-Registry nicht verfügbar sein, bis John Doe (und nur John Doe) ihn in einer anderen .com IDN TLD oder im .com-Registry registriert.

Lokale Sprachversionen von .com und .net

Verisign hat im Rahmen des Programms für neue generische Top-Level-Domains (gTLD) neun Transliterationen für .com und drei für .net beantragt, um Unternehmen vollständige .com- und .net-Domainnamen in lokalen Sprachzeichen anbieten zu können.

.com
.net
.com

Kyrillisch

.net

Devanagari

.com

Hebräisch

.net

Vereinfachtes Chinesisch

.com

Arabisch

.net

Hangul

.com

Devanagari

.com

Thai

.com

Katakana

.com

Vereinfachtes Chinesisch

.com

Traditionelles Chinesisch

.com

Hangul

Registrieren von IDNs


Ein Registrant fordert einen IDN bei einem Registrar an, der IDNs im Angebot hat. Der Registrar wandelt die jeweiligen Sonderzeichen der lokalen Sprache in eine Sequenz von unterstützten Zeichen um. Dazu benutzt er eine Technologie namens ACE (ASCII-Compatible Encoding). Der Registrar schickt die ACE-Zeichenkette zum Verisign® Shared Registration System (SRS), wo sie validiert wird. Der IDN wird den .com- bzw. .net-TLD-Zonendateien hinzugefügt und im Internet verteilt.


Auflösen von IDNs

Wenn ein Benutzer einen IDN mit muttersprachlichen Zeichen in einen Webbrowser eingibt bzw. einen Link aufruft, kodieren Anwendungen mit IDN-Unterstützung die Zeichen in eine ACE-Zeichenkette, die vom DNS verstanden wird. Das DNS verarbeitet die Anforderung und gibt die Daten an die Anwendung zurück. Obwohl dieser Vorgang einfach klingt, waren für Anwendungen mit IDN-Unterstützung und DNS-Unterstützung für unterschiedliche Sprachen sowie Schriften umfangreiche Forschungs- und Entwicklungsarbeiten erforderlich.

IETF-Standards



Die Internet Engineering Task Force (IETF) war maßgeblich an der Entwicklung von Standards zum Einsatz von Nicht-ASCII-Zeichen im Domain Name System (DNS) beteiligt.

Das DNS erkennt nur die ASCII-Zeichen A–Z, 0-9 und „-“. Dies begrenzt die Anzahl von Zeichen, die zum Erstellen von Domainnamen verwendet können, auf 37 im Gegensatz zu über 96.000 in Unicode. Zum Erstellen von Domainnamen mit Unicode-Zeichen muss ein Zeichenkodierungsschema verwendet und standardisiert werden, das Unicode-Codepunkte eindeutig einer ASCII-Darstellung zuordnet.

Die IETF hat folgende Standards für Internationalisierte Domainnamen (IDN) veröffentlicht: Encoding Scheme (Kodierungsschemas), Framework, Protocol, Unicode und Right-to-left-Scripts (Von-rechts-nach-links-Sprachen).

Kodierungsschema

Das Kodierungsschema für IDNs nutzt Punycode, eine mit ASCII kompatible Kodierung (ACE), die Zeichen der lokalen Sprache so als ASCII-Zeichen kodiert, dass das DNS eine Anforderung eines Adresseneintrags exakt beantworten kann. Die IETF wählte Punycode als ACE-Standard, da dieser einen idealen Kompromiss zwischen Komprimierung und Implementierung bot. Punycode lässt die Darstellung der größten Anzahl an Zeichen (Codepunkten) zu und ist einfach zu installieren.

Framework [RFC 5890]

Dieses RFC gehört zu einer Gruppe, die Protokoll- und Nutzungskontext für eine Revision internationalisierter Domainnamen für Anwendungen (IDNA) beschreibt, der 2008 weitgehend vervollständigt wurde und im Rahmen der Serie und anderswo als „IDNA2008“ bekannt ist. Diese Serie ersetzt eine frühere IDNA-Version [RFC 3490] [RFC 3491]. Der Einfachheit halber wird diese IDNA-Version als „IDNA2003“ bezeichnet. Die neuere Version verwendet weiterhin den Punycode-Algorithmus [RFC3492] und die ACE- (ASCII-kompatible Codierung) Vorsilbe der früheren Version.

Protocol [RFC 5891]

Dieses RFC beschreibt das IDNA2008-Kernprotokoll und dessen Operationen. In Verbindung mit dem nachstehend beschriebenen „birektionalen“ (Bidi) Dokument aktualisiert und ersetzt es ausdrücklich [RFC 3490].

Unicode [RFC 5892]

Dieses RFC legt Regeln fest, nach denen entschieden werden kann, ob ein allein oder in Kontext stehender Codepunkt in einen IDN aufgenommen werden kann. Es ist Teil der Vorschrift IDNA2008.

Right-to-Left Scripts [RFC 5893]

Die Nutzung von rechts nach links verlaufender Schriften in internationalisierten Domainnamen (IDNs) stellt in verschiedener Hinsicht eine Herausforderung dar. Dieses RFC definiert neue Bidi-Regeln für IDNA- (Internationalisierte Domainnamen für Anwendungen (IDNA) Labels basierend auf den durch einige Schriften verursachten Problemen und diversen Mängeln des 2003 IDNA Bidi-Kriteriums.

Rationale [RFC 5894]

Dieses RFC formuliert Hintergrund, Erklärung und Gründe, warum neue RFCs erforderlich sind, um Probleme zu lösen, die aus der (den) früheren Version(en) der IDNA entstanden sind. Dieses RFC erörtert außerdem die Notwendigkeit einer Aktualisierung der in IDN unterstützten Unicode-Version.

Veröffentlichte RFCs

Folgende Standards wurden veröffentlicht und sind verfügbar:

Verisign hat sich der Einhaltung der IETF-Standards und der Unterstützung der schnellen Implementierung dieser neuen Technologie verschrieben.

Schriften und Sprachen



Internationalized Domain Names (IDN) sind Second- oder Third-Level-Domainnamen oder Webadressen, die in einem beliebigen in Unicode definierten Zeichensatz bzw. einer Schrift registriert sind.

Damit Sie verstehen können, wie Verisign-IDNs die Domainnamen-Registrierung in Hunderten von Sprachen in nur einem Shared Registration System (SRS) unterstützen, müssen Sie wissen, wie Zeichen und Schriften aus der Schriftsprache für den Einsatz auf dem Computer umgesetzt werden.

Beziehung zwischen Schrift, Zeichen und Sprache

Schrift Lateinisch Arabisch Han Griechisch
Zeichen L س 漢字 Ω
Sprache Englisch Farsi Chinesisch Griechisch

Schrift

Eine Schrift ist eine Sammlung von Symbolen, die Textinformationen in einer Sprache darstellen. Beispiele für Schriften: Lateinisch, Arabisch, Han, Griechisch.

Zeichen

Ein Zeichen ist der Grundbaustein einer Schriftsprache. Es kann nicht weiter zerlegt werden, ohne an Bedeutung zu verlieren.

Schriftsprache

Eine Schriftsprache nutzt Zeichen aus einem oder mehreren Schriftsystemen, um Bedeutung zu vermitteln. Beispiele für Sprachen: Deutsch, Farsi, Chinesisch, Griechisch.

Anpassen von Sprachen an verschiedene Computer

Verschiedene Sprachen nutzen verschiedene Tastaturen bzw. Tastenbelegungen für die Eingabe auf Computergeräten. Computer-Betriebssysteme enthalten Eingabemethoden-Editoren (IME), die die Eingabe verschiedener Schriften ermöglichen. IDNs sind eine ähnliche Anpassung und ermöglichen die Verwendung der lokalen Sprache zum Surfen im Internet, Senden und Empfangen von E-Mails, Übertragen von Dateien und Ausführen anderer Vorgänge, für die Domainnamen erforderlich sind.

Unicode

Ein Computer versteht Zeichen anhand der Kodierung. Jedem Zeichen eines Zeichensatzes ist eine eindeutige Nummer zugeordnet. Beispiel: Im Zeichensatz ASCII ist dem großen A die Nummer 65 zugeordnet. Die meisten Domainnamen sind in ASCII-Zeichen (A bis Z, 0 bis 9 und Trennstrich „-“) registriert. Nicht-englische Sprachen, die diakritische Zeichen verwenden, wie beispielsweise Spanisch und Französisch sowie Sprachen, die keine lateinischen Schriftsysteme verwenden, wie Kanji und Arabisch, können nicht in ASCII wiedergegeben werden. Unicode ist ein universell kodierter Zeichensatz, der 350 verschiedene Sprachen umfasst. Daher nutzen IDNs Unicode.

Sprach-Tags

Die IDN-Infrastruktur von Verisign entspricht den Richtlinien des ICANN Registry Implementation Committee (RIC) und erfordert, dass jeder IDN durch einen „Sprach-Tag“ mit einer bestimmten Sprache verknüpft wird. Der Registrant wählt das IDN-Sprach-Tag während der Registrierung aus. Wenn ein IDN mehrere Sprachen kombiniert, muss der Registrant die bestgeeignete Sprache wählen. (Heute werden nicht alle Sprach-Tags referenziert. Durch Erfassen der Informationen während der Registrierung wird jedoch die zukünftige Nutzung von Sprachtabellen ermöglicht. Laden Sie die PDF-Liste der gültigen Verisign Sprach-Tags herunter

Sprachtabellen

Wenn eine IDN-Registrierung angefordert wird, wird das Sprach-Tag mit einer Liste von Sprachen verglichen, für die Zeicheneinschlusstabellen oder Zeichenvariantenzuordnungstabellen vorhanden sind. Diese Tabellen werden auf die Unicode-Punkte der Registrierung angewendet, um zu bestimmen, ob die Registrierung für eine bestimmte Sprache gültig ist. Schlägt eine Registrierung für eine Sprache fehl, ist der Zeichensatz eventuell trotzdem mit einem anderen Sprach-Tag verfügbar.

Zeichenvarianten


Verisign hat im Interesse der Beteiligten an der Lösung des Zeichenvariantenproblem gearbeitet. Registranten registrieren i.d.R. Domainnamen, die eine Bedeutung in ihrer Sprache haben (ein Name, ein Wort oder eine Wortfolge). Bestimmte Schriften werden jedoch von mehreren Sprachen genutzt.

Daher kann ein Domainname in anderen Sprachen oder Kulturen eine andere Bedeutung haben. Die möglichen Varianten sind in vier Kategorien eingeteilt: Zeichen, Orthografie, Lexemik und Kontext. Verisign ist der Meinung, dass Zeichenvarianten berücksichtigt werden müssen, damit Benutzer das Internet in ihrer Muttersprache nutzen können. Die anderen Varianten erfordern schwierige linguistische Entscheidungen, die für die Bereitstellung einer robusten IDN-Lösung nicht wichtig sind.

Chinesische Zeichenvarianten

In vielen Sprachen existieren Zeichenvarianten, die bei den Endbenutzern potenziell zu Verwechslungen führen könnten. Beispiel: Es gibt zwei chinesische Schriftsprachen: Vereinfachte Form, die überwiegend auf dem Festland verwendet wird, und die traditionelle Form, die überwiegend in Taiwan, Hongkong und anderen südostasiatischen Ländern verwendet wird. Zwar haben die beiden Schriftsprachen viele gemeinsame Zeichen, doch können vereinfachte Zeichen im vereinfachten Chinesisch dieselbe Bedeutung haben wie komplexe Zeichen im traditionellen. Diese Zeichen werden Zeichenvarianten genannt und haben dieselbe Bedeutung und Aussprache, sehen aber unterschiedlich aus.

Eine Lösung für Zeichenvarianten

Verschiedene Experten auf dem Gebiet haben verschiedene Lösungsmöglichkeiten für das Problem der Zeichenvarianten vorgeschlagen. Jeder Vorschlag hat Vor- und Nachteile. Die IDN-Gemeinschaft ist sich jedoch einig, dass das Problem der Zeichenvarianten niemals umfassend gelöst werden kann, da sich Sprachen ständig verändern. Neue Zeichenvarianten werden immer wieder zwischen bestimmten Sprachen auftauchen. Verisign nutzt Sprach-Tags, die sich auf Sprachtabellen beziehen, um das Problem mit Zeichenvarianten zu umgehen.

Verisign hat dabei mit interessierten Parteien (z.B. China Network Information Center (CNNIC) (.cn), Taiwan Network Information Center (TWNIC) (.tw), National Internet Development Agency of Korea (.kr), Japan Registry Service (JPRS) (.jp), Chinese Domain Name Consortium (CDNC) und dem von ICANN in die Welt gerufenen IDN Implementation Committee zusammengearbeitet.

Richtlinie

Verisign hat eine Richtlinie für IDN-Registrierungen entwickelt, die zulässige und unzulässige Codepunkte definiert.

Das Verisign Shared Registration System (SRS) erlaubt das Erstellen von Internationalized Domain Names (IDNs), die Zeichen aus von Unicode unterstützten Nicht-ASCII-Schriften enthalten.

Registrierungsregeln

Erfahren Sie mehr über die fünf Validierungsregeln für die Implementierung der Richtlinie.


Regeln anzeigen

Zusätzliche Logik

Nach der Validierung eines IDN führt Verisign basierend auf dem Sprach-Tag der Registrierung weitere Logik aus.


Zusätzliche Logik anzeigen