REST解惑
REST全称是Representational State Transfer,目前普遍接受的中文翻译为「表述性状态转移」!
即使翻译过来了,你依然有一堆疑问:
- 什么是「表述性」的?
- 什么是状态?
- 什么是转移?
- 转移的是什么?
所以本文试图回答如下几个问题:
- 为什么要叫REST这个名字?
- 什么是状态、资源、表述?
- 以及它们之间有什么关系?
- 什么是转移(Transfer)、变迁(transitions)?转移什么?变迁什么?
为什么叫REST?
为什么Fielding博士要取这么个难以理解的名字呢?其实REST论文的第六章给出了明确的答案:
REST was originally referred to as the "HTTP object model," but that name would often lead to misinterpretation of it as the implementation model of an HTTP server. The name "Representational State Transfer" is intended to evoke an image of how a well-designed Web application behaves: a network of web pages (a virtual state-machine), where the user progresses through the application by selecting links (state transitions), resulting in the next page (representing the next state of the application) being transferred to the user and rendered for their use.
REST本来是想叫「HTTP object model」的,但是这个名字会给人误解,让人误以为REST是一个HTTP服务器的实现。叫REST这个名字的目的是为了暗示一个「设计良好的Web应用」应该有怎样的行为:一个由web页面组成的网(一个虚拟状态机),用户通过选择链接在应用中前进(状态变迁),用户的选择会导致下一个页面(代表应用的下一个状态)被转移到用户端、并被渲染出来以供使用!
Tips:注意上面括号里的单词(state transitions),这里是transitions而不是transfer。transitions表示的是过渡、切换、变迁,比如场景的切换,就是从一个场景到了另一个场景。这里是从一个状态切换到了另一个状态。REST中文文档里,还是将其翻译成了「转移」,应该是不正确的!
网上很多讨论REST的文章或帖子,关注的点有两个:
- Representational应该怎么翻译?是「表述」还是「表述性」
- Transfer应该怎么翻译?是「转移」还是「传输」
而从上面这段话,你会发现,重点既不是Representational、也不是Transfer,而是State!你有没有觉得上面所提到的State和你平时所理解的State有差异?或者说比较违和?
我们都知道,要保证服务端的伸缩性,就要确保服务端是无状态的!如果是「无状态」的,那么为什么有「状态的变迁」呢?难道REST没有伸缩性?显然不是,要知道,Web可是现今伸缩性最好的系统!
所以这里所指的State与我们平时所说的State不是一个概念!这里的State是「应用状态」,我们所说的State是「资源状态」(这里所说的资源和REST中所指的资源也是不一样的,下面会说到)!
先说应用状态,在上文中,可以看到。应用状态指的是一个个的Web页面!Web页面上有链接,你点击链接后,这个链接所对应的「应用状态」会从服务器「转移」到客户端,渲染出来,展示给你。你就「切换」到了下一个「应用状态」!
所以「State Transfer」指的是:「应用状态」从服务端「转移」到了客户端,导致客户端的「应用状态」从当前状态「变迁」到了下一个状态!
资源与表述
在解释「资源状态」之前,要先来解释一下什么是「资源」?什么是「表述」?
早期URI设计时,「资源」表示的是「文档」!它假设万维网里转移的都是文档!现在看来,显然不是!REST对「资源」进行了抽象!
一般我们对资源的理解是「可以在万维网里转移的任何内容」,比如:网页、图片、视频等!但实际上,REST论文中给出的定义和我们平常所理解的「资源」差异还是很大的!
REST论文中给出的解释:
The resource is not the storage object. The resource is not a mechanism that the server uses to handle the storage object. The resource is a conceptual mapping -- the server receives the identifier (which identifies the mapping) and applies it to its current mapping implementation (usually a combination of collection-specific deep tree traversal and/or hash tables) to find the currently responsible handler implementation and the handler implementation then selects the appropriate action+response based on the request content.
资源不是存储对象!也不是服务器处理存储对象的机制!资源是一个概念上的映射关系:服务器接收到标示符(这些标示符标示了这个映射关系),将其应用到当前的映射实现上(一般是特定集合【深度遍历的树和/或哈希表】的组合)来找到当前负责处理该请求的处理器、这个处理根据请求内容选择合适的动作+响应
我用一段伪代码来解释一下!
var mappingImpl = {'/pathA':handlerA,'/pathB':handlerB,'/pathC':handleC,...}