脚本和语言

IDN(国际化域名)是通过任意字符集或在 Unicode 中定义的脚本注册的二级或三级域名或网址。


要想弄清 Verisign IDN 如何通过单个共享注册系统 (SRS) 支持数百种本地语言的域名注册,您需要理解在书面语言中使用的字符和脚本是如何转换成计算机语言的。

脚本、字符和语言之间的关系

脚本拉丁语阿拉伯语han希腊语
字符Lس漢字Ω
语言英语波斯语中文希腊语

脚本

脚本是语言中用来表示文本信息的符号集。脚本的例子:拉丁语、阿拉伯语、汉语、希腊语。

字符

字符是任意脚本因而也是任意书面语言的基本构成单元。它具有最基本的意义,您无法进一步分割字符使其仍具有意义。

书面语言

书面语言使用一个或多个脚本中的字符以传达意义。语言的例子:英语、波斯语、汉语、希腊语。

将语言转化为计算机符号

不同的脚本使用不同的键盘或软键盘作为计算机输入设备。计算机操作系统的输入法编辑器 (IME) 有利于不同脚本的输入。IDN 是一种类似的转换方式,它使人们可以通过本地语言脚本导航网站、发送和接收电子邮件、传输文件以及进行其他与域名相关的操作。

Unicode

计算机通过编码字符以理解它们 对字符集内的每个字符都分配唯一的数字。比如,在 ASCII 码字符集中,大些字母“A”分配的数字是 65。大多数域名是以 ASCII 字符注册的(从 A 到 Z、从 0 到 9 和连字符“-”)。但是,非英语单词需要附加符号,如西班牙语和法语,而且 ASCII 字符不提供使用非拉丁脚本的语言,如日本汉字和阿拉伯语。Unicode 是一种通用编码字符集,它涵盖多达 350 种不同的本地语言。因此,IDN 使用 Unicode。

语言标记

Verisign IDN 基础架构遵从 ICANN 注册管理机构执行委员会 (RIC) 的指导说明并要求每个 IDN 必须与使用“语言标记”的特定语言有联系。注册者在注册过程期间选择 IDN 语言。如果某个 IDN 结合多种语言,注册者必须选择最适合的语言。(今天不会提到所有语言标记;但是在注册过程中捕捉信息有助于将来采用语言表。) 下载威瑞信有效语言标记列表 (PDF)

语言表

需要进行 IDN 注册时,对照包含字符列入表或字符异体映射表的语言列表检查语言标记。这些表格均适用于注册的 Unicode点,以确定该注册是否对特定语言有效。如果某种语言的注册失败,那么将仍然存在带有不同语言标记的字符集。

是否要了解更多信息?