VARIAN KARAKTER

Verisign berupaya mengatasi masalah varian karakter dengan pemegang kepentingan terkait. Pendaftar biasanya mendaftarkan nama domain yang memiliki arti dalam bahasanya sendiri, misalnya nama, kata, atau frasa. Namun demikian, satu skrip dapat digunakan lebih dari satu bahasa.


Sebagai hasilnya, nama domain dapat memiliki arti berbeda dalam konteks bahasa atau budaya lainnya. Fenomena varian telah diklasifikasikan ke dalam empat kategori berbeda: varian karakter, ortografik, leksemik, dan kontekstual. Verisign telah menetapkan bahwa penanganan varian karakter penting untuk memungkinkan pengguna menavigasi internet dalam bahasa mereka sendiri. Varian lainnya memerlukan penilaian linguistik sulit yang tidak penting untuk menghasilkan solusi IDN yang canggih.

VARIAN KARAKTER MANDARIN

Berbagai bahasa mungkin memiliki varian karakter yang berpotensi menimbulkan kebingungan bagi pengguna akhir. Misalnya, bahasa Mandarin memiliki dua format tertulis: Mandarin Modern, terutama digunakan di Cina Daratan (RRC), dan Mandarin Tradisional, terutama digunakan di Taiwan, Hong Kong, dan negara-negara Asia Tenggara lainnya. Dua format tertulis tersebut memiliki banyak karakter yang sama; namun, karakter modern pada Mandarin Modern mungkin memiliki arti sama seperti karakter pada Mandarin Tradisional yang lebih rumit. Karakter tersebut, disebut varian karakter, memiliki arti dan penyebutan sama, namun terlihat berbeda.

SOLUSI VARIAN KARAKTER

Pemimpin yang memiliki pemikiran berbeda dalam komunitas teknis menyarankan pendekatan berbeda untuk menangani masalah varian karakter ini. Setiap pendekatan memiliki aspek positif dan negatif. Namun demikian, komunitas IDN sepakat bahwa masalah varian karakter mungkin tidak akan pernah diatasi sepenuhnya karena bahasa selalu berubah. Varian karakter baru di antara bahasa akan terus diperkenalkan dalam bahasa. Verisign telah menerapkan tag bahasa yang mengacu pada tabel bahasa untuk mengatasi masalah varian karakter.

Verisign telah berupaya mengatasi masalah varian karakter bersama pemegang kepentingan terkait, termasuk Pusat Informasi Jaringan Cina (CNNIC) (.cn), Pusat Informasi Jaringan Taiwan (TWNIC) (.tw), Lembaga Pengembangan Internet Nasional Korea (.kr), Layanan Registri Jepang (JPRS) (.jp), Konsorsium Nama Domain Cina (CDNC), dan Komisi Penerapan IDN yang ditetapkan ICANN.

TAG BAHASA

Infrastruktur IDN Verisign sesuai dengan pedoman Komisi Penerapan Registri (RIC) ICANN dan mengharuskan setiap IDN dikaitkan dengan bahasa khusus menggunakan "tag bahasa". Pendaftar memilih tag bahasa IDN selama proses pendaftaran. Jika IDN menggabungkan lebih dari satu bahasa, maka pendaftar harus memilih bahasa yang paling sesuai. (Tidak semua tag bahasa direferensikan hari ini; namun, pengambilan informasi selama proses pendaftaran memungkinkan penerapan tabel bahasa di masa mendatang. Download daftar Tag Bahasa Valid Verisign (PDF).

TABEL BAHASA

Bila mengajukan permohonan pendaftaran IDN, maka tag bahasa akan diperiksa terhadap daftar bahasa yang memiliki tabel penyertaan karakter atau tabel pemetaan varian karakter. Tabel ini diterapkan pada titik kode Unicode yang membuat pendaftaran menentukan validitas pendaftaran untuk bahasa tertentu. Jika pendaftaran gagal untuk satu bahasa, maka kumpulan karakter mungkin masih tersedia dengan tag bahasa lain.

Tabel Bahasa yang Diterapkan dalam Solusi Varian Karakter Verisign

BAHASATitik Kode
Cina
Jepang
PolandiaHanya karakter Latin
YunaniU+002D, U+0030 melalui U+0039, U+0370 melalui U+03FF
RusiaU+002D, U+0030 melalui U+0039, U+0400 melalui U+04FF, U+0500 melalui U+052F
BelarusiaU+002D, U+0030 melalui U+0039, U+0400 melalui U+04FF, U+0500 melalui U+052F
UkrainaU+002D, U+0030 melalui U+0039, U+0400 melalui U+04FF, U+0500 melalui U+052F
SerbiaU+002D, U+0030 melalui U+0039, U+0400 melalui U+04FF, U+0500 melalui U+052F
MakedoniaU+002D, U+0030 melalui U+0039, U+0400 melalui U+04FF, U+0500 melalui U+052F
BulgariaU+002D, U+0030 melalui U+0039, U+0400 melalui U+04FF, U+0500 melalui U+052F

TITIK KODE IDN

Sistem Pendaftaran Bersama (SRS) Verisign memungkinkan pendaftar mendaftarkan IDN melalui pencatat dalam skrip yang terdapat dalam Unicode 5.3 dan dialihkan melalui spesifikasi Protokol IDNA2008 (RFC 5891). Untuk memungkinkan skrip langka, notasi musik, dan karakter khusus lainnya, Verisign telah menetapkan titik kode yang diizinkan, terbatas, dan terlarang dalam Kebijakan kami untuk Titik Kode IDN.

PERLU INFORMASI LEBIH LANJUT?