本文共 2172 字,大约阅读时间需要 7 分钟。
最近拜读了大牛许令波大神的著作《深入分析JavaWeb技术内幕》,感觉颇有受益,决定写一写读书笔记,以作总结。第一章,我们就来讲一讲Web请求过程。
随着Web2.0时代的到来,互联网的网络架构已从传统的C/S架构转变为更加方便快捷的B/S架构。这种转变不是没有原因的,下面我们就来说说B/S架构的优点。
主要从两方面来阐述B/S的有点:客户端和服务端。
客户端使用统一的浏览器(Browser)。由于浏览器具有统一性,他不需要特殊的配置和网络连接。有效地屏蔽了不同服务提供商提高给用户使用服务的差异性。另外最重要的一点是浏览器的易用性,能使用户更加轻松方便地使用,大大降低了学习门槛。
服务端(Server)基于统一的HTTP。和传统的C/S架构使用自己定义的应用层协议不同,B/S架构使用统一的HTTP。使用统一的HTTP也为服务提供商简化了开发模式。有很多现成的基于HTTP的服务器,不仅如此,连开发服务的通用框架都不需要单独开发,这大大降低了开发门槛,因此也出现了越来越多的互联网服务。
由此可见,B/S是基于HTTP的,那HTTP又是什么呢?它是如何建立连接的呢?
HTTP是应用层的一种采用无状态的短连接的通信方式。通常情况下,一次请求就完成了一次数据交互,通常也对应一个业务逻辑,然后这次通信连接就断开了。采用这种方式是为了能够同时服务更多的用户,因为当前互联网应用每天都会处理上亿的用户请求,不可能每个用户访问一次后就一直保持这个连接。
目前的B/S网络架构大多采用下图形式:
以下是原文截图,关于一次请求的过程。
当然,不管网络架构如何变化,始终有一些固定不变的原则。
1.互联网上所有资源都要用一个URL来表示。URL是统一资源定位符,不要小看URL,他几乎包含了整个互联网架构的精髓。当然,这个精髓貌似正在受到Ajax的挑衅。
2.必须基于HTTP与服务端交互。(HTTPS只是在HTTP的基础上加了个安保措施SSL[Secure Socket Layer]安全套接层)
3.数据必须在浏览器中被展示。
那HTTP如何发起请求呢。其实发起HTTP请求和建立一个Socket连接区别不大。只不过outputStream.write写的二进制字节数据格式要符合HTTP格式要求。浏览器就是根据解析出来的IP地址和默认的80端口与远程服务器建立Socket连接,然后浏览器再根据这个URL组装成一个get类型的HTTP请求头发送到服务器。当然,这个过程我们完全可以自己模拟。
我们再来讲一讲HTTP解析:
Ctrl+F5组合键刷新后,会在请求头加两个请求项。Pragma:no-cache和Cache-Control:no-cache。它们有什么作用呢?
DNS域名解析是浏览器请求的一个非常重要的过程。我们平时上网可能感觉不到DNS解析的存在,但一旦DNS解析出错,哪台根服务器坏了,那互联网会出些灾难。
DNS域名解析可以分成10步,其中任何一步完成了域名解析,就不再往下进行。
1.查看浏览器缓存
2.查看操作系统缓存
3.向LDNS(本地DNS服务器)发起请求
4.向Root Server(根域名服务器)发起请求
5.根域名服务器返回给本地域名服务器一个所查询的主域名服务器(gTLD Server)。gTLD是国际顶级域名服务器,如.com,.cn,.org等,全球只有13台左右。
6.本地服务器再向上一步返回的gTLD服务器发送请求。
7.接受请求的gTLD服务器查找并返回此域名对应的Name Server域名服务器。
8.Name Server域名服务器会查询存储的域名和IP的映射关系表。
9.返回IP,通常情况下也会返回一个TTL,LDNS缓存时间由TTL值控制。
10.LDNS把解析的结果返回给用户,用户也根据得到的TTL值将结果缓存在本地系统缓存中。
在实际域名解析过程中,可能还不止这10个步骤,如Name Server也可能有多级,或者有一个GTM来进行负载均衡控制,这都有可能会影响域名解析过程。
Linux和Windows都可以用nslookup命令来查询域名的解析结果。
最后我们来讲一讲CDN架构:
CDN也就是内容分布网络(Content Delivery Network),它是构筑在现有Internet上的一种先进的流量分配网络。
原文截图:
通常的CDN架构:
负载均衡(Load Balance)就是对工作任务进行平衡,分摊到多个操作单元上执行,如图片服务器、应用服务器等,共同完成工作任务。他可以提高服务器响应速度和利用率,避免软件或者硬件模块出现单点失效,解决网络拥塞问题,实现地理位置无关性,为用户提供较一致的访问质量。
通常有三种负载均衡架构:链路负载均衡(通过DNS解析来完成),集群负载均衡(分硬件和软件),操作系统负载均衡(通过软中断或者硬件中断)。