如何发起一个HTTP请求和如何建立一个socket连接区别不大,只不过outputstream.write写的二进制字节数据格式要符合HTTP,浏览器在建立socket连接之前,必须根据地址栏里输入的URL的域名DNS解析出IP地址,然后再根据ip地址和端口与对应的远程服务器建立socket连接。然后浏览器根据URL组装成一个get类型的http请求头,通过outputStream.write发送到目标服务器。服务器等待inputStream.read返回数据,最后断开这个连接。
发起一个HTTP连接本质上就是建立一个socket连接。
curl "
http://www.baidu.com"
常见的http状态码:200成功。302临时跳转,400客户端请求有语法错误。403拒绝服务,404请求资源不存在。500服务器错误
当我们使用ctrl+F5组合键刷新一个页面时,在HTTP的请求头中会增加一些请求头,它告诉服务器我们要获取最新的数据而不是缓存。在其请求头增加了两个请求项:pragma:no-cache和cache-control:no-cache
DNS域名解析过程:1.浏览器会检查缓存中有没有这个域名对应的解析过的ip地址。2.查找操作系统缓存中是否有这个域名对应的dns解析结果。在linux中,这个配置文件是/etc/hosts。3.发送给域名服务器。4.到Root Server域名服务器请求解析。5.根域服务器返回给本地域名服务器一个所查询域的主域名服务器(国际顶级域名服务器,全球只有13台),6.本地服务器再向上一步返回的主域名服务器发送请求。7.主域名服务器返回此域名对应的Name Server域名服务器的地址,Name Server域名服务器会查询存储的域名和ip的映射关系表。9.返回该域名对应的IP.
可用nslookup查询域名的解析结果。
在linux中还可以使用dig命名来查询域名的解析结果。
在JAVA应用中,JVM也会缓存DNS的解析结果,这个缓存是在InetAddress类中完成的。如果需要通过InetAddress类解析域名,必须是单例模式,不然会有严重的性能问题。如果每次都创建InetAddress实例,则每次都要进行一次完整的域名解析,非常耗时。
负载均衡通常有三种架构:链路负载均衡,集群负载均衡,操作系统负载均衡。链路负载均衡也就是通过DNS解析成不同的IP,然后用户根据这个IP来访问不同的目标服务器。
深入分析java I/O的工作机制
基于字节操作的I/O接口:InputStream , OutputStream
基于字符操作的I/O接口:Writer , Reader
基于磁盘操作的I/O接口:File
基于网络操作的I/O接口:Socket
OutputStream out = new BufferedOutputStream(new ObjectOutputStream(new FileOutputStream("fileName")))
不管是磁盘还是网络传输,最小的存储单元都是字节,而不是字符。
InputStreamReader类是从字节到字符的转化桥梁,从InputStream到Reader的过程要指定编码字符集。
try{
StringBuffer str = new StringBuffer();
cahr[] buf = new char[1024];
FileReader f = new FileReader("file");
while(f.read(buf) > 0){
str.append(buf);
}
str.toString();
}catch(Exception e){
}
FileReader继承了InputStreamReader类。实际上是读取文件流,然后解码成char。
通过OutputStreamWriter类完成了从字符到字节的编码过程。
几种访问文件的方式:读取和写入文件操作都需要调用操作系统提供的接口,读和写分别对应read()和write()两个系统调用。而只要是系统调用就存在内核空间地址和用户空间地址切换的问题,这是操作系统为了保护本身的安全,将内核运行使用的内存和用户程序运行的内存进行隔离。虽然保证了安全性,但却存在数据需要从内核空间向用户空间复制的问题。
标准访问方式:当应用程序调用read()接口时,操作系统检查在内核的高速缓存中有没有需要的数据,如果已经缓存,直接从缓存中返回,如果没有,则从磁盘中读取,然后缓存在操作系统的缓存中。写入时,用户的应用程序调用write()接口将数据从用户地址空间复制到内核地址空间的缓存中,这时对用户来说写操作已经完成,至于什么时候再写到磁盘中由操作系统决定,除非显式调用sync同步命令。
直接I/O方式:应用程序直接访问磁盘数据,而不经过操作系统内核数据缓冲区。减少一次从内核缓冲区到用户程序缓存的数据复制,这种访问文件的方式通常是在对数据的缓存管理由应用程序实现的数据库管理系统中。
同步文件访问:数据的读取和写入都是同步操作的,只有当数据被成功写入磁盘时才返回给应用程序成功的标志。性能较差,在安全性要求比较高的场景中才会使用。
异步文件访问:当访问数据的线程发出请求后,线程会接着去处理其他事情,而不是阻塞等待。
内存映射的方式:内存映射的方式是指操作系统将内存中的某一段区域与磁盘中的文件关联起来,当要访问内存中的一段数据时,转换为访问文件的某一段数据。这种方式的目的同样是减少数据从内核空间缓存到用户空间缓存的数据复制操作,因为这两个空间的数据是共享的。
java访问磁盘文件:当传入一个文件路径时,将会根据这个路径创建一个File对象来标识这个文件,然后根据这个File对象创建真实的读取文件的操作对象,这时将会真正创建一个关联真实存在的磁盘文件的文件描述符FileDescriptor,通过这个对象可以直接控制这个磁盘文件,由于需要字符格式,所以需要StreamDecoder类将byte解码为char格式。至于如何从磁盘驱动器上读取一段数据,操作系统会帮我们完成。