01-web开发相关概念与常见web服务器
Web开发的相关知识
Web,在英语中web即表示网页的意思,它用于表示Internet主机上供外界访问的资源。
Internet上供外界访问的Web资源分为:
静态web资源(如html界面):指web页面中供人们浏览的数据始终是不变的。
动态web资源:指web页面中供人们浏览的数据是由程序产生的,不同时间点访问web页面看到的内容各不相同。
静态web资源开发技术
Html
常用动态web资源开发技术
JSP/Servlet、ASP、PHP等
在Java中,动态web资源开发技术称为Javaweb,我们课程的重点也是教大家如何使用Java技术开发动态的web资源,即动态web页面。
WEB服务器
学习web开发,需要先安装一台web服务器,然后再在web服务器中开发相应的web资源,供用户使用浏览器访问。
常见WEB服务器
WebLogic是BEA公司的产品,是目前应用最广泛的Web服务器,支持J2EE规范,而且不断的完善以适应新的开发要求。
另一个常用的Web服务器是IBM公司的WebSphere,支持J2EE规范。
在小型的应用系统或者有特殊需要的系统中,可以使用一个免费的Web服务器:Tomcat,该服务器支持全部JSP以及Servlet规范。
JBOSS支持J2EE规范,和Tomcat共同搭建起支持J2EE规范的服务器。
Tomcat官方站点:
http://jakarta.apache.org
获取Tomcat安装程序包
tar.gz文件时Linux操作系统下的安装版本
exe文件时Windows系统下的安装版本
zip文件时Windows系统下的压缩版本
安装Tomcat
互联网上常用协议的工作端口
http 80
smtp 25
pop3 110
ftp 23
https 443
02-web服务器启动问题
常见启动问题
Java_home环境变量
在windows中设置java_home环境变量
只要在setclasspath.bat批处理文件第一次使用JAVA_HOME环境变量之前的任何地方,将JAVA_HOME环境变量设置为JDK的主目录,就可以使用startup.bat文件启动Tomcat了。
端口占用问题
Catalina_home环境变量的设置问题
03-tomcaat服务器目录结构
04-web应用和虚似目录的映射
Web应用程序
Web应用程序指供浏览器访问的程序,通常也简称为web应用。
一个web应用由多个静态web资源和动态web资源组成,如:
html、css、js文件
Jsp文件、java程序、支持jar包
配置文件等等......
组成web应用的这些文件通常我们会使用一个目录组织,这个目录称之为web应用所在目录。
Web应用开发好后,若想供外界访问,需要把web应用所在目录交给web服务器管理,这个过程称之为虚拟目录的映射。
<Context path="/itcast" docBase="c:\news"/>这种配置不好,需要重启服务器。
For Tomcat 6, unlike Tomcat 4.x, it is NOT recommended to place <Context> elements directly in the server.xml file. This is because it makes modifing the Context configuration more invasive since the main conf/server.xml file cannot be reloaded without restarting Tomcat.
Context elements may be explicitly defined:
1.In the $CATALINA_BASE/conf/context.xml file: the Context element information will be loaded by all webapps.
2.In the $CATALINA_BASE/conf/[enginename]/[hostname]/context.xml.default file: the Context element information will be loaded by all webapps of that host.
3.In individual files (with a ".xml" extension) in the $CATALINA_BASE/conf/[enginename]/[hostname]/ directory. The name of the file (less the .xml extension) will be used as the context path. Multi-level context paths may be defined using #, e.g. foo#bar.xml for a context path of /foo/bar. The default web application may be defined by using a file called ROOT.xml.
4.Only if a context file does not exist for the application in the $CATALINA_BASE/conf/[enginename]/[hostname]/, in an individual file at /META-INF/context.xml inside the application files. If the web application is packaged as a WAR then /META-INF/context.xml will be copied to $CATALINA_BASE/conf/[enginename]/[hostname]/ and renamed to match the application's context path. Once this file exists, it will not be replaced if a new WAR with a newer /META-INF/context.xml is placed in the host's appBase.
5.Inside a Host element in the main conf/server.xml.
05-web应用组织结构和web.xml文件的作用
Web应用的组成结构
开发web应用时,不同类型的文件有严格的存放规则,否则不仅可能会使web应用无法访问,还会导致web服务器启动报错。
web.xml文件
Web.xml文件是整个web应用中最重要的配置文件,它必须放在WEB-INF目录中。在开发web应用时,但凡涉及到对web应用中的web资源进行配置,通通是在web.xml文件中进行设置。例如:
某个web资源配置为网站首页
将servlet程序映射到某个url地址上
为web应用配置监听器
为web应用配置过滤器
……
认识web.xml文件的作用:
通过web.xml文件把某个web资源配成网站首页。
06-配置虚似主机(搭建网站)
配置虚拟主机
在一个tomcat服务器中可以放置多个网站,所谓配置虚拟主机,就是在tomcat服务器中配置一个网站。
如需在WEB服务器中配置一个网站,需使用Host元素进行配置,例:
<Host name="site1" appBase="c:\app"></Host>
配置的主机(网站)要想被外部访问,必须在DNS服务器或windows系统中注册。
配置多个网站。
缺省虚拟主机。
<Host name="www.sina.com" appBase="c:\sina">
<Context path="/mail" docBase="c:\sina\mail"/>
</Host>
07-UML描述web资源访问流程
其它问题
画图演示web资源的访问过程
打包web应用war
jar -cvf news.war news 打成war包后服务器可以自动解压
配context元素的reloadable元素,让tomcat自动加载更新后的web应用,实际开发最好不要配置
Tomcat的体系结构和配置https连接器 公钥 私钥
keytool -genkey -alias tomcat -keyalg RSA
Tomcat服务器的管理平台
web应用的开发前景B/S C/S
08-tomcat体系结构
09-软件密码学基础和配置tomcat的https连接器
作业
在webapps目录下创建一个可供外界访问的web应用。
在server.xml文件中进行配置,把c:盘下的某一个web应用映射成可供外界访问的虚拟目录。
在catalina/localhost目录下进行设置,把c:盘下的某一个web应用映射成可供外界访问的虚拟目录。
在server.xml文件中配置一台www.itcast.cn的虚拟主机,然后在window系统中注册www.itcast.cn这台主机。
在虚拟主机的根目录下创建一个名称为itcast的web应用,并在该应用下创建一个index.html页面,然后把web应用映射成缺省web应用。index.html页面设置为web应用的首页。
将web服务器端口更改为80端口。
画图说明浏览器是如何访问到web服务器下的web主机下的web应用下的web资源的。
Context元素常用属性
dcoBase
path
reloadable
unpackWar
10-http协议概述和动手实践认识Http协议
HTTP协议
什么是HTTP协议
客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客户端与web服务器通讯的格式。
使用telnet程序连上web服务器,并使用HTTP协议获取某个页面,快速了解HTTP协议的作用。
安装IE浏览器插件HttpWatch,查看IE浏览器通过HTTP协议获取某个页面。
cmd.exe-->telnet localhost 8080-->GET /hailangxing/1.html HTTP/1.1
Host:(缺省主机直接回车)
HTTP协议简介
HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程。
HTTP协议是学习JavaWEB开发的基石,不深入了解HTTP协议,就不能说掌握了WEB开发,更无法管理和维护一些复杂的WEB站点。
HTTP协议的版本:HTTP/1.0、HTTP/1.1
HTTP1.0和HTTP1.1的区别
在HTTP1.0协议中,客户端与web服务器建立连接后,只能获得一个web资源。
HTTP1.1协议,允许客户端与web服务器建立连接后,在一个连接上获取多个web资源。
使用telnet举例说明。
一个好多同学搞不清楚的问题:
一个web页面中,使用img标签引用了三幅图片,当客户端访问服务器中的这个web页面时,客户端总共会访问几次服务器,即向服务器发送了几次HTTP请求。
设计的时候要减少HTTP请求数
11-Http请求行和请求方式详解
HTTP请求
客户端连上服务器后,向服务器请求某个web资源,称之为客户端向服务器发送了一个HTTP请求。一个完整的HTTP请求包括如下内容:
一个请求行、若干请求头、以及实体内容。
举例:
GET /book/java.html HTTP/1.1 请求行
Accept:*/* 多个消息头
Accept-Language:en-us
Connection:Keep-Alive
Host:localhost
Referer:http://localhost/links.asp
User-Agent:Mozilla/4.0
Accept-Encoding:gzip,deflate
一个空行
请求行:请求行用于描述客户端的请求方式、请求的资源名称、以及使用的HTTP协议版本号。
请求头:请求头用于描述客户端请求哪台主机,以及客户端的一些环境信息等。
HTTP请求的细节——请求行
请求行中的GET称之为请求方式,请求方式有:
POST、GET、HEAD、OPTIONS、DELETE、TRACE、PUT
常用的有:GET、POST
用户如没有设置,默认情况下浏览器向服务器发送的都是get请求,例如在浏览器直接输地址访问,点超链接访问等都是get,用户如想把请求方式改为post,可通过更改表单的提交方式实现。
不管POST或GET,都用于向服务器请求某个WEB资源,这两种方式的区别主要表现在数据传递上:
如请求方式为GET方式,则可以在请求的URL地址后以?的形式带上交给服务器的数据,多个数据之间以&进行分隔,例如:
GET/mail/1.html?name=abc&password=xyz HTTP/1.1
GET方式的特点:在URL地址后附带的参数是有限制的,其数据容量通常不能超过1K。
如请求方式为POST方式,则可以在请求的实体中内容中向服务器发送数据,Post方式的特点:传送的数据量无限制。
默认get,可以改为post
<form action="/1.html" method="post">
<input type="text" name="username"><input type="submit" value="提交">
</form>
12-Http请求头各个头字段详解
HTTP请求的细节——消息头
用于HTTP请求中的常用头
Accept:text/html,image/*
Accept-Charset:ISO-8859-1
Accept-Encoding:gzip,compress
Accept-Language:en-us,zh-cn
Host:www.it315.org:80
If-Modified-Since:Tue,11 Jul 2000 18:23:51 GMT
Referer:http://www.it315.org/index.jsp
User-Agent:Mozilla/4.0(compatible;MSIE5.5;Windows NT 5.0)
Cookie
Connection:close/Keep-Alive
Data:Tue,11 Jul 2000 18:23:51 GMT
请求头
Accept:用于告诉服务器,客户机支持的数据类型
Accept-Charset:用于告诉服务器,客户机采用的编码
Accept-Encoding:用于告诉服务器,客户机支持的数据压缩格式
Accept-Language:客户机的语言环境
Host:客户机通过这个头告诉服务器,想访问的主机名
If-Modified-Since:客户机通过这个头告诉服务器,资源的缓存时间
Referer:客户机通过这个头告诉服务器,它是从哪个资源来访问服务器的(防盗链)
User-Agent:客户机通过这个头告诉服务器,客户机的软件环境
Cookie:客户机通过这个头可以向服务器带数据
Connection:close/Keep-Alive
Date:Tue,11 Jul 2000 18:23:51 GMT
13-Http响应和响应状态行详解
HTTP响应
一个HTTP响应代表服务器向客户端回送的数据,它包括:
一个状态头、若干消息头、以及实体内容。
举例:
HTTP/1.1 200 OK 状态行
Server:Microsoft-IIS/5.0 多个响应头
Date:Thu,13 Jul 2000 05:46:53 GMT
Content-Length:2291
Content-Type:text/html
Cache-control:private
一个空行
<HTML> 实体内容
<BODY>
……
状态行:状态行用于描述服务器对请求的处理结果。
多个响应头:消息头用于描述服务器的基本信息,以及数据的描述,服务器通过这些数据的描述信息,可以通知客户端如何处理等一会儿它回送的数据。
实体内容:代表服务器向客户端回送的数据。
状态行
格式:HTTP版本号 状态码 原因叙述<CRLF>
举例:HTTP/1.1 200 OK
状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。响应状态码分为5类,如下所示:
状态码 含义
100~199 表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程
200~299 表示成功接收请求并已完成整个处理过程,常用200
300~399 为完成请求,客户需进一步细化请求。例如,请求的资源已经移动到一个新地址,常用302、307和304
400~499 客户端的请求有错误,常用404、403
500~599 服务器端出现错误,常用500
200-->OK
302-->找别人
307、304-->拿缓存
403-->有资源, 但没有访问权限
404-->服务器没这个资源
500-->服务器端出问题了
14-Http响应头字段详解
HTTP需要细节——常用响应头
HTTP请求中的常用响应头
Location:http://www.it315.org/index.jsp
Server:apache tomcat
Content-Encoding:gzip
Content-Length:80
Content-Language:zh-cn
Content-Type:text/html;charset=GB2312
Last-Modified:Tue,11 Jul 2000 18:23:51 GMT
Refresh:1;url=http://www.it315.org
Content-Disposition:attachment;filename=aaa.zip
Transfer-Encoding:chunked
Set-Cookie:SS=Q0=5Lb_nQ;path=/search
ETag:W/"7777-1242234904000"
Expires:-1
Cache-Control:no-cache
Pragma:no-cache
Connection:close/Keep-Alive
Date:Tue,11 Jul 2000 18:23:51 GMT
响应头:
Location:这个头配合302状态码使用,用于告诉客户找谁
Server:服务器通过这个头,告诉浏览器服务器的类型
Content-Encoding:服务器通过这个头,数据的压缩格式
Content-Length:服务器通过这个头,告诉浏览器回送数据的长度
Content-Type:服务器通过这个头,告诉浏览器回送数据的类型
Last-Modified:服务器通过这个头,告诉浏览器当前资源缓存时间
Refresh:服务器通过这个头,告诉浏览器隔多长时间刷新一次
Content-Disposition:服务器通过这个头,告诉浏览器以下载方式打开数据
Transfer-Encoding:服务器通过这个头,告诉浏览器数据的传送格式
ETag:缓存相头的头
Expires:服务器通过这个头,告诉浏览器把回送的资源缓存多长时间,-1或0,则是不缓存
Cache-Control:no-cache
Pragma:no-cache
服务器通过以上两个头,也是控制浏览器不要缓存数据