2008年12月23日星期二

URL统一资源定位符

URL(uniform resource locator):统一资源定位符,是用于完整描述internet上网页和其他资源的地址的一种标识方法。
一个URL示例:http://www.w3c.org/portocols/index.html
Protocol://(协议)

Servername.domain(服务器名.域)

Directory/(目录)

File(文件)


在上述示例中: 协议是HTTP ;全称域命名为www.w3c.org ;目录名为protocols ;文件为index.html


注:大多数WEB服务器都配置为可自动提供缺省主页。在大多数情况下,缺省主页为index.html,其他可能的缺省主页为:home.html、default.html、home.htm及index.htm。使用这一属性,URL:http://www.w3c.org/protocols/将返回protocols目录下的index.html文件。
其他常见的URL为:

ftp://服务器域名/目录/文件 通过匿名FTP请求文档

ftp://用户名@服务器域名/目录/文件 使用用户名访问FTP请求文档

telnet://服务器域名 使用telnet访问服务器

news://新闻服务器域名/新闻组 请求访问usenet新闻组


用户也可以使用URL向服务器传递数据。典型应用为向服务器方函数传递参数。

例如: http://服务器域名/目录/文件/file.html?用户名=Jamison&uid=300 此URL向file.html主页传递一对参数:用户名Jamison和UID 300。

有时,需要在URL中包含特殊字符如空隔或斜杠(/)。此时,这些特殊字符必须重新编码以避免服务器出现问题。编码过程(有时指16进制编码)包括将特殊字符用其16进制的数取代。

例如:假设用户需要在URL中列出用户全名: http://服务器域名/目录/file.html?用户名=Neal%20Jamison 在示例中,Neal和Jamison间的空隔由与空隔等价的16进制的数取代。在URL中传递的信息通常使用通用网关接口(CGI)程序处理。


主流的WEB服务器:Apache、 IIS(internet information server)


http协议使Web服务器和浏览器可以通过Web交换数据。它是一种请求/响应协议,即服务器等待并响应客户方请求。HTTP不维护与客户方的连接,它使用可靠的TCP连接,通常采用TCP80端口。客户/服务器传输过程可以分为四个基本步骤:

1、浏览器与服务器建立连接

2、浏览器向服务器请求文档

3、服务器响应浏览器请求

4、断开连接

HTTP是一种无状态协议,它不维护连接的状态信息。


HTTP/1.1 为了使服务器与客户端(web brower)通信称为可能,HTTP协议建立了一种由请求和响应消息组成的WEB语言。

1、客户请求

客户请求包含以下信息:请求方法、请求头、请求数据


请求方法是用于特定URL或WEB页面的程序。下面是可用的请求方法: 方法 描述

GET 请求指定的文档

HEAD 仅请求文档头

POST 请求服务器接收指定文档作为可执行的信息

PUT 用从客户端传送的数据取代指定文档中的内容

DELETE 请求服务器删除指定页面

OPTIONS 允许客户端查看服务器的性能

TRACE 用于测试---允许客户端查看消息回收过程


头信息是可选项,它用于向服务器提供客户端的其他信息。
头 描述

Accept 客户端接收的数据类型

Authorzation 认证消息,包括用户名和口令

User-Agent 客户方软件类型

Referer 用户获取的WEB页面 如果客户采用某种方法获取数据(如post),数据就放在头(head)之后;否则客户机等待从服务器传来的响应。


2、服务器响应

服务器响应包括以下关键部分: 状态码 响应头 响应数据
HTTP定义了多组返回给浏览器的状态码

响应头向客户方提供服务器和(或)请求文档的信息。所有的头均以空行结束。

方法 描述

Server WEB服务器信息

Date 当前日期/时间

Last Modified 请求文档最近修改时间

Expires 请求文档过期时间

Content-length 数据长度(字节)

Content-type 数据MIME类型

WWW-authenticate 用于通知客户方需要的认证信息(如用户名,口令等) 如果有客户方请求的数据,数据放在响应头之后,否则服务器断开连接。
MIME与WEB

多用途互联网邮件扩充(Multipurpose internet Email Extension MIME),它是一种多用途网际邮件扩充协议,最早应用于电子邮件,但后来也应用到浏览器。服务器会将它们发送的多媒体数据的类型告诉浏览器,而通知手段就是说明该多媒体数据的MIME类型,从而让浏览器知道接收到的信息那些是MP3文件,哪些是Shockwave文件等等,服务器将MIME标志符放入传送的数据中来告诉浏览器使用那种插件读取相关文件。

当WEB浏览器与服务器建立连接时,它们协商MIME类型。浏览器向服务器发送它所能接收的MIME类型,这部分信息位于请求头标中。服务器通知客户方它发送的数据包含的MIME类型。
MIME类型 描述

text/plain 纯ASCII码文本

text/html HTML文本

image/gif GIF图像

image/jpeg JPEG图像

application/msword Microsoft Word video/mpeg MPEG视频 audio/wave Wave音频

application/x-tar Tar压缩数据

例如:text是指是文本文件,plain是指文本的格式。image指明是图像,gif指明图像的格式。application是指是应用程序,msword指明是word。video指明是视频,mpeg指明视频的格式。audio指明是音频文件,wave指明格式。

没有评论:

发表评论