蒂姆·伯纳斯-李（Tim Berners-Lee）：语义网

::: {#f620 .section .section .section—body .section—first .section—last} ::: section-divider

:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn}

蒂姆·伯纳斯-李（Tim Berners-Lee）：语义网 {#8ed8 .graf .graf—h3 .graf—leading .graf—title name=“8ed8”}

一种对计算机有意义的新形式的Web内容将释放一场新可能性的革命

当电话铃声响起时，娱乐系统正在播放披头士乐队的歌曲《We Can Work It Out》。皮特接听电话时，他的手机通过向所有其他具有音量控制的本地设备发送消息，将声音调低了。他的姐姐露西在医生办公室打来电话：“妈妈需要去看一位专科医生，然后必须进行一系列的物理治疗。可能是每两周一次。我打算让我的代理来安排这些预约。“皮特立刻同意分担接送任务。在医生办公室，露西通过她的手持Web浏览器指示她的语义网代理。该代理迅速从医生的代理那里检索了关于妈妈的处方治疗信息，查阅了几份提供者列表，并检查了那些在她家20英里半径范围内、属于妈妈保险计划内且在受信任的评级服务上获得优秀或非常好评级的提供者。然后，它开始尝试在可用预约时间（由各个提供者的代理通过其Web站点提供）和皮特与露西繁忙的日程之间找到匹配。（粗体强调的关键词表示其语义或含义已通过语义网为代理定义。）

几分钟后，代理向他们展示了一个计划。皮特不喜欢 --- --- 大学医院离妈妈家太远了，而且他需要在交通高峰期折返回来。他设置自己的代理，用更严格的关于地点和时间的偏好来重新进行搜索。露西的代理，在这种任务背景下完全信任皮特的代理，自动提供了访问证书和它已经整理过的数据的快捷方式来协助。

新的计划几乎是瞬间呈现的：一个近得多的诊所和更早的时间 --- --- 但有两个警告提示。首先，皮特将不得不重新安排他几个不那么重要的预约。他查看了它们是什么 --- --- 没问题。另一个是关于保险公司列表未能将该提供者纳入物理治疗师类别：“服务类型和保险计划状态已通过其他方式安全验证，“代理向他保证。“（详细信息？）”

露西在皮特咕哝着”免去那些细节”的同一时刻表示了同意，然后一切都安排好了。（当然，皮特忍不住想知道细节，那天晚上晚些时候让他的代理解释了它是如何在提供者未列在正确的列表上时找到它的。）

表达含义

皮特和露西之所以能够使用他们的代理来执行所有这些任务，不是因为今天的万维网，而是因为它未来将演变而成的语义网。今天Web上的大部分内容都是为人类阅读而设计的，而不是为计算机程序进行有意义的操作而设计的。计算机可以巧妙地解析网页的布局和常规处理 --- --- 这里是一个标题，那里是一个指向另一个页面的链接 --- --- 但总的来说，计算机没有可靠的方法来处理其语义：这是哈特曼和施特劳斯理疗诊所的主页，这个链接指向哈特曼医生的简历。

语义网将为网页有意义的内容带来结构，创造一个软件代理可以轻松地从一个页面漫游到另一个页面并为用户执行复杂任务的环境。这样一个代理访问诊所的网页时，不仅会知道该页面有诸如”治疗、药物、身体、疗法”之类的关键词（就像今天可以编码的那样），还会知道哈特曼医生周一、周三和周五在这家诊所工作，并且该脚本以yyyy-mm-dd格式接受日期范围并返回预约时间。它”知道”所有这一切，而不需要达到《2001太空漫游》中的哈尔或《星球大战》中的C-3PO那样的人工智能水平。相反，这些语义是在诊所的办公室经理（她从未上过《计算机科学101》）使用现成的软件和物理治疗协会网站上列出的资源来撰写语义网页并进行整理时，被编码进网页的。

语义网不是一个独立的Web，而是现有Web的延伸，其中信息被赋予了明确的定义，从而更好地使计算机和人能够协同工作。将语义网编织到现有Web结构中的第一步已经开始。在不久的将来，随着机器变得更擅长处理和”理解”它们目前仅仅是显示的数据，这些发展将迎来重大的新功能。

万维网的基本特性是它的普遍性。超文本链接的力量在于”任何东西都可以链接到任何东西”。因此，Web技术不能区分草稿和精美的成品，不能区分商业信息和学术信息，也不能区分文化、语言、媒体等等。信息沿着许多轴线变化。其中之一是主要为人类消费而产生的信息与主要为机器而产生的信息之间的差异。在一端，我们有从五秒钟的电视商业广告到诗歌的一切。在另一端，我们有数据库、程序和传感器输出。迄今为止，Web发展最快是作为供人阅读的文档的媒介，而不是可以自动处理的数据和信息的媒介。语义网的目标是弥补这一点。

像互联网一样，语义网将尽可能地去中心化。这种类似Web的系统在从大公司到个人用户的每个层面上都引起了极大的兴奋，并带来了事先难以或无法预测的好处。去中心化需要妥协：Web必须抛弃其所有互连都完全一致的理想，从而带来了臭名昭著的”Error 404: Not Found”消息，但也允许了未经检查的指数级增长。

知识表示

为了使语义网发挥作用，计算机必须能够访问结构化的信息集合和推理规则集，以便它们可以用于进行自动化推理。在Web出现很久之前，人工智能研究人员就已经在研究此类系统了。这项技术通常被称为知识表示，它目前的状态类似于Web出现之前的超文本：它显然是一个好主意，并且存在一些非常好的演示，但它尚未改变世界。它蕴含着重要应用的种子，但要充分发挥其潜力，它必须被连接到一个单一的全球系统中。传统的知识表示系统通常是集中式的，要求每个人都必须共享对”父母”或”交通工具”等共同概念的完全相同的定义。但中央控制是抑制性的，并且增加此类系统的规模和范围很快就会变得难以管理。

此外，这些系统通常会仔细限制可以提出的问题，以便计算机能够可靠地回答 --- --- 或者说能够回答。这个问题让人想起数学中的哥德尔定理：任何一个复杂到足以有用的系统也都包含无法回答的问题，就像基本悖论”这句话是假的”的复杂版本一样。为了避免这些问题，传统的知识表示系统通常都有自己狭隘且特殊的一套推理规则来处理其数据。例如，一个作用于家谱数据库的家谱系统，可能包含”叔叔的妻子是阿姨”这条规则。即使数据可以从一个系统转移到另一个系统，但以完全不同形式存在的规则通常无法转移。

相比之下，语义网的研究人员接受悖论和无法回答的问题是为了实现多功能性而必须付出的代价。我们使规则的语言具有所需的表达力，以允许Web进行所需范围的推理。这种哲学类似于传统Web的哲学：在Web发展的早期，批评者指出它永远不可能成为一个组织良好的图书馆；如果没有一个中央数据库和树状结构，人们永远无法确定能找到所有东西。他们说对了。但该系统的表达能力使海量信息可用，而搜索引擎（在十年前看来是相当不切实际的）现在对大量现有材料产生了非常完整的索引。因此，语义网的挑战在于提供一种既能表达数据，又能表达用于对数据进行推理的规则的语言，并且允许任何现有知识表示系统中的规则被导出到Web上。

为Web添加逻辑 --- --- 即使用规则进行推理、选择行动方案和回答问题的手段 --- --- 是当前语义网社区面临的任务。数学和工程的混合决策使这项任务复杂化。逻辑必须足够强大，能够描述对象的复杂属性，但又不能强大到让代理因被要求考虑悖论而陷入困境。幸运的是，我们想要表达的绝大多数信息都类似于”六角头螺栓是一种机械螺栓”，这很容易用现有的语言加上一点额外的词汇来编写。

用于开发语义网的两项重要技术已经到位：可扩展标记语言 (XML) 和资源描述框架 (RDF)。XML允许每个人创建自己的标签 --- --- 隐藏的标签，例如 <zip code>{.markup—code .markup—p-code} 或 <alma mater>{.markup—code .markup—p-code}，它们可以注释网页或页面上的文本部分。脚本或程序可以以复杂的方式利用这些标签，但脚本编写者必须知道页面编写者使用每个标签的目的。简而言之，XML允许用户向其文档添加任意结构，但对这些结构意味着什么却一无所知 [参见乔恩·博萨克和蒂姆·布雷在《科学美国人》1999年5月刊发表的”XML与第二代Web”] 。

含义是通过 RDF 来表达的，它以三元组的形式进行编码，每个三元组都非常类似于一个基本句子的主语、动词和宾语。这些三元组可以用XML标签编写。在RDF中，文档做出断言：特定的事物（人、网页或其他任何事物）具有某些属性（例如”是…的姐妹”、“是…的作者”），并带有特定的值（另一个人、另一个网页）。事实证明，这种结构是描述机器处理的绝大多数数据的自然方式。主语和宾语都通过通用资源标识符 (URI) 来识别，就像网页链接中使用的那样。（URL，即通用资源定位符，是最常见的URI类型。）动词也通过URI来识别，这使得任何人都可以通过在Web上的某个地方为新概念、新动词定义一个URI来定义它。

人类语言在使用同一个术语来表示略微不同的事物时会发展壮大，但自动化则不然。想象一下，我雇了一个小丑信使服务在我客户生日时送气球。不幸的是，该服务将地址从我的数据库转移到他们的数据库，却不知道我的数据库中的”地址”是寄送账单的地方，其中许多是邮政信箱。我雇来的小丑最终招待了许多邮政工作人员 --- --- 这不一定是件坏事，但肯定不是预期的效果。对每个特定概念使用不同的URI解决了这个问题。可以区分邮寄地址和街道地址，并且两者都可以与演讲的地址区分开来。

RDF的三元组形成了关于相关事物的信息之网。因为RDF使用URI在文档中编码这些信息，所以URI确保了概念不仅仅是文档中的词语，而是与每个人都可以在Web上找到的唯一义绑定在一起。例如，假设我们可以访问各种包含人员信息的数据库，包括他们的地址。如果我们想找到居住在特定邮政编码的人，我们需要知道每个数据库中的哪些字段代表姓名，哪些字段代表邮政编码。RDF可以指定”（数据库A中的字段5）（是属于…类型的字段）（邮政编码）“，并使用URI而不是短语来表示每个术语。

本体

当然，故事到这里还没有结束，因为两个数据库可能对实际上是同一个概念（例如邮政编码）使用不同的标识符。一个想要比较或组合来自这两个数据库信息的程序，必须知道这两个术语被用来表示相同的事物。理想情况下，该程序必须有一种方法来发现它遇到的任何数据库的这种共同含义。

解决这个问题的方法由语义网的第三个基本组成部分提供，即被称为本体的信息集合。在哲学中，本体论是关于存在本质、关于存在哪些类型事物的理论；本体论作为一个学科研究的就是这类理论。人工智能和Web研究人员将这个术语挪用到他们自己的行话中，对他们来说，本体是一个正式定义术语之间关系的文档或文件。Web上最典型的本体包含一个分类法和一套推理规则。

分类法定义了对象的类别以及它们之间的关系。例如，地址可以被定义为位置的一种类型，城市代码可以被定义为仅适用于位置，等等。类别、子类别以及实体之间的关系是Web使用的一个非常强大的工具。我们可以通过将属性分配给类别并允许子类别继承这些属性来表达实体之间的大量关系。如果城市代码必须是城市类型，而城市通常有网站，那么即使没有数据库将城市代码直接链接到网站，我们也可以讨论与城市代码相关的网站。

本体中的推理规则提供了进一步的力量。一个本体可以表达这样一条规则：“如果一个城市代码与一个州代码相关联，并且一个地址使用了该城市代码，那么该地址就具有相关联的州代码。“然后，程序就可以很容易地推断出，例如，康奈尔大学的地址位于伊萨卡（Ithaca），就一定在纽约州，而纽约州在美国，因此应该按照美国标准进行格式化。计算机并没有真正”理解”所有这些信息，但它现在可以以对人类用户有用且有意义的方式更有效地操作这些术语。

有了Web上的本体页面，术语（和其他）问题的解决方案就开始出现了。Web页面上使用的术语或XML代码的含义可以通过从页面到本体的指针来定义。当然，如果我指向一个将地址定义为包含zip code的本体，而您指向一个使用postal code的本体，那么就会出现与以前相同的问题。如果本体（或其他Web服务）提供等价关系，这种混淆就可以解决：我们的一个或两个本体可能包含我的 zip code 等同于您的 postal code 的信息。

当我们两个数据库指向不同的地址定义时，我们雇用小丑去招待客户的方案就部分解决了。程序对不同的地址概念使用不同的URI，因此不会将它们混淆，而且实际上它需要发现这些概念是相关联的。然后，程序可以使用一项服务，该服务接受一个邮寄地址列表（在第一个本体中定义），并通过识别和移除邮政信箱及其他不合适的地址，将其转换为一个物理地址列表（第二个本体）。本体提供的结构和语义使企业家更容易提供此类服务，并可以使其使用完全透明。

本体可以通过多种方式增强Web的功能。它们可以以简单的方式用于提高Web搜索的准确性 --- --- 搜索程序可以只查找那些引用精确概念的页面，而不是所有使用含糊关键词的页面。更高级的应用将使用本体将页面上的信息与相关的知识结构和推理规则联系起来。一个用于此类用途而标记的页面示例可以在线访问：http://www.cs.umd.edu/~hendler{.markup—anchor .markup—p-anchor data-href=“https://link.zhihu.com/?target=http%3A//www.cs.umd.edu/~hendler” rel=“nofollow noreferrer noopener” target=“_blank”}。如果您将Web浏览器发送到该页面，您将看到标题为”Dr. James A. Hendler”的普通网页。作为人类，您可以很容易地找到指向简短传记注释的链接，并在那里读到亨德勒获得了布朗大学的博士学位。然而，试图找到此类信息的计算机程序将不得不非常复杂，才能猜到这些信息可能在传记中，并理解那里使用的英语。

对于计算机来说，该页面链接到一个本体页面，该本体页面定义了有关计算机科学系的信息。例如，教授在大学工作，他们通常拥有博士学位。页面上的进一步标记（通常的Web浏览器不会显示）使用本体的概念来指定亨德勒从URI http://www.brown.edu{.markup—anchor .markup—p-anchor data-href=“https://link.zhihu.com/?target=http%3A//www.brown.edu/” rel=“nofollow noreferrer noopener” target=“_blank”} 所描述的实体 --- --- 即布朗大学的网页 --- --- 获得了博士学位。计算机还可以发现亨德勒是某个特定研究项目的成员，拥有特定的电子邮件地址等等。所有这些信息都可以被计算机轻松处理，并可用于回答目前需要人类筛选搜索引擎找到的各种页面内容才能回答的查询（例如亨德勒博士在哪里获得的学位）。

此外，这种标记使得开发能够解决答案不只存在于单个网页上的复杂问题的程序变得更加容易。假设您想找到去年在贸易会议上遇到的库克女士。您不记得她的名字，但您记得她为您的一位客户工作，并且她的儿子是您母校的学生。一个智能搜索程序可以筛选所有名字叫”Cook”的人的页面（避开所有与厨师、烹饪、库克群岛等相关的页面），找到那些提到为您的客户名单上的公司工作的页面，并跟踪链接到他们孩子的网页，以查明是否有任何人在正确的地点上学。

代理

语义网的真正力量将在于人们创建大量程序，这些程序能够从不同来源收集Web内容、处理信息并与其他程序交换结果时得以实现。随着机器可读的Web内容和自动化服务（包括其他代理）变得越来越可用，此类软件代理的效率将呈指数级增长。语义网促进了这种协同作用：即使是未明确设计为协同工作的代理，当数据附带语义时，它们之间也可以传输数据。

代理功能的一个重要方面将是交换以语义网统一语言编写的”证明”（即表达使用规则和信息（如本体所指定的那样）进行的逻辑推理的语言）。例如，假设库克女士的联系信息已被一个在线服务找到，并且令您大吃一惊的是，它将她定位在约翰内斯堡。自然，您想核实这一点，因此您的计算机要求该服务提供其答案的证明，该服务会通过将其内部推理翻译成语义网的统一语言来迅速提供。您计算机中的推理引擎可以轻松验证这位库克女士确实与您正在寻找的那位匹配，如果您仍然有疑问，它可以向您展示相关的网页。尽管它们距离挖掘语义网的潜力还很遥远，但一些程序已经可以使用当前统一语言的初步版本以这种方式交换证明。

另一个重要特征将是数字签名，它是加密的数据块，计算机和代理可以使用它来验证所附信息是由特定的可信来源提供的。您希望非常确定发送给您的会计程序的、关于您欠某个在线零售商钱的声明，不是由隔壁精通计算机的青少年伪造的。代理在检查信息来源之前，应该对它们在语义网上读取的断言保持怀疑态度。（我们希望更多人能在目前的Web上学会这样做！）

许多自动化的基于Web的服务已经存在，但没有语义，而其他程序（例如代理）无法找到能够执行特定功能的服务。这个过程被称为服务发现，只有当存在一种通用语言来描述服务，使其他代理能够”理解”所提供的功能以及如何利用它时，才能发生。服务和代理可以通过例如将此类描述存入类似于黄页的目录中来宣传它们的功能。

目前有一些低级别的服务发现方案可用，例如微软的通用即插即用 (Universal Plug and Play)，它侧重于连接不同类型的设备，以及昇阳电脑公司的 Jini，它旨在连接服务。然而，这些举措是在结构或句法层面解决问题，并严重依赖于预定功能描述集的标准化。标准化的作用是有限的，因为我们无法预测所有可能的未来需求。

相比之下，语义网更加灵活。消费者和生产者代理可以通过交换本体来达成共享的理解，本体提供了讨论所需的词汇。当代理发现新本体时，它们甚至可以**“自举”新的推理能力**。语义也使得利用仅部分匹配请求的服务变得更容易。

一个典型的过程将涉及创建”价值链”，其中信息的子组件从一个代理传递到另一个代理，每个代理都”增加价值”，以构建最终用户请求的最终产品。请不要误会：为了按需自动创建复杂的价值链，一些代理除了语义网之外，还将利用人工智能技术。但语义网将提供基础和框架，使这些技术更具可行性。

将所有这些特性结合在一起，就形成了本文开头情景中皮特和露西的代理所展现出的能力。他们的代理会以零碎的方式将任务委托给通过服务广告发现的其他服务和代理。例如，他们可以使用一个可信赖的服务来接收提供者列表，并确定其中哪些提供者属于指定的保险计划和治疗方案。这个提供者列表将由另一个搜索服务提供，等等。这些活动形成了价值链，其中分散在Web上（并且以那种形式几乎毫无价值）的大量数据被逐步简化为对皮特和露西具有高价值的少量数据 --- --- 一个符合他们日程和其他要求的预约计划。

在下一步中，语义网将突破虚拟领域，扩展到我们的物理世界。URI可以指向任何东西，包括物理实体，这意味着我们可以使用RDF语言来描述手机和电视等设备。这些设备可以宣传它们的功能 --- --- 它们能做什么以及如何被控制 --- --- 很像软件代理。由于比通用即插即用等低级方案灵活得多，这种语义方法开启了一个充满令人兴奋的可能性的世界。

例如，今天被称为家庭自动化的功能需要仔细配置才能使电器协同工作。对设备能力和功能的语义描述将使我们能够以最少的人工干预实现这种自动化。当皮特接听电话时，立体声被调低就是一个微不足道的例子。他不必对每台特定设备进行编程，而是可以一劳永逸地对这种功能进行一次编程，以涵盖所有宣传拥有音量控制的本地设备 --- --- 电视、DVD播放器，甚至是他晚上从工作带回家的笔记本电脑上的媒体播放器。

在这个领域已经迈出了第一个具体步骤，正在努力开发一个用于描述设备功能能力（如屏幕尺寸）和用户偏好的标准。这个基于RDF构建的标准被称为复合能力/偏好配置文件 (CC/PP)。最初，它将允许手机和其他非标准Web客户端描述其特征，以便Web内容可以即时为它们定制。稍后，当我们添加用于处理本体和逻辑的语言的全部多功能性时，设备就可以自动搜索并使用服务和其他设备来获取额外信息或功能。不难想象，您的支持Web的微波炉会咨询冷冻食品制造商的网站以获取最佳烹饪参数。

知识的演化

语义网并非”仅仅”是我们到目前为止讨论的、用于执行个别任务的工具。此外，如果设计得当，语义网可以协助整个人类知识的演化。

人类的努力被困在独立行动的小群体效率与需要与更广泛社区协调一致之间的永恒张力中。小群体可以快速有效地创新，但这会产生一个亚文化，其概念不被其他人理解。然而，在大群体中协调行动极其缓慢，需要大量的沟通。世界在这些极端之间运作，倾向于从小处开始 --- --- 从个人想法开始 --- --- 并随着时间的推移走向更广泛的理解。

一个基本的过程是，当需要更广泛的共同语言时，亚文化的汇合。通常，两个群体会独立地开发出非常相似的概念，而描述它们之间的关系会带来巨大的益处。就像一本芬兰语-英语词典，或一张度量衡换算表一样，这些关系允许沟通和协作，即使概念的共性尚未（或尚未）导致术语的共性。

语义网通过简单地用URI命名每个概念，让任何人都能以最小的努力表达他们发明的新概念。其统一的逻辑语言将使这些概念逐步被链接到一个通用的Web中。这种结构将向软件代理开放人类的知识和运作方式进行有意义的分析，提供了一类新的工具，通过它们我们可以共同生活、工作和学习。

原文是 2001 年《Scientific American》上的经典论文 --- --- Tim Berners-Lee 与 James Hendler、Ora Lassila 合著的《The Semantic Web（语义网）：让计算机真正”读懂”网页，将引爆一场新的可能性革命》。 ::: ::: :::