今天们将要讲到的是大型站点的一种常用做法,将缓存部署在反向代理服务器上,这类缓存们通常称之为反向代理缓存。
到目前为止,们讨论了把缓存存放在ASP.NET的输出缓存中(内存和硬盘),以及浏览器缓存中,而大型站点的另一种常用做法是将缓存部署在反向代理服务器上,这类缓存们通常称之为反向代理缓存,比如Squid和Varnish。这两款软件通常都部署在非WINDOWS平台上,对于Windows平台上的Asp.net来说,其实一样能使用,们完全可以把反向代理软件部署在LINUX上,然后代理会路由到后台的WINDOWS WEB(IIS)服务器。总之,非WINDOWS的世界很精彩。
当然,无论是squid还是varnish都有Windows的扩展版本。本文为了简便起见,基于varnish的Windows版本来描述的。
varnish的官方站点:https://www.varnish-cache.org/,
varnish的Windows版本:http://www.cygwin.com/,如果要编译过的直接可用的版本,在这里:http://www.software112.com/products/cygwin-varnish-cache.html。
1:将varnish配置为IIS的代理
首先需要为varnish准备配置文件,比如,可以为default.vcl,内容如下:
backend default { .host = 192.168.0.77 ; .port = 80 ; } sub vcl_fetch { remove beresp.http.Set-Cookie; } sub vcl_recv { remove req.http.Cookie; }
在们要示范的这个实例中,这3个配置都不能少,如下,
backend default:指定们的IIS站点的地址和端口;
sub vcl_fetch:这是一个varnish函数,它varnish从后端服务器,也就是IIS中获得数据后被调用;
sub vcl_recv:varnish函数,表示客户端请求杠杠到达反向代理服务器时被调用;
由于varnish默认在碰到http头中含有Cookie相关标识时直接忽略缓存,所以们需要上面的两个函数针对Cookie做特殊处理。当然,目前这两个函数只是简单而野蛮的删除标识,实际的应用中们可能需要根据实际情况为它们加上一些判断条件。
2:启动varnish
下面的命令为启动varnish:
C:varnishin varnishd -a :8011 -T :8088 -f c:/varnish/etc/default.vcl -s file,c:/varnish/var/cache,100M
-a:8011表示,让varnish监听在8011端口。由于测试环境下varnish和iis是在同一台机器上,所以IIS已经占用了80,这里只有使用其它端口。
-T是为varnish指定一个管理端口;
-f指定所要使用的配置文件;
后面的参数只是让varnish使用文件缓存,大小为100M,当然,应该根据实际情况指定大小;
启动varnish后,如果们请求http://地址:端口/,就可以等到200OK状态码,那表示varnish已经在正确滴接受请求。
3:一个实例
创建asp.net页面,内容如下:
protected void Page_Load(object sender, EventArgs e) { this.Response.AddHeader( Cache-Control , max-age=60 ); this.Response.AddHeader( Last-Modified , DateTime.Now.ToString( U , DateTimeFormatInfo.InvariantInfo)); DateTime IfModifiedSince; if (DateTime.TryParse(this.Request.Headers.Get( If-Modified-Since ), out IfModifiedSince)) { if ((DateTime.Now - IfModifiedSince.AddHours(8)).Seconds 60) { Response.Status = 304 Not Modified ; Response.StatusCode = 304; return; } } string conn = Data Source=192.168.0.77;Initial Catalog=luminjidb;User Id=sa;Password=sa; ; using (DataSet ds = Common.SqlHelper.ExecuteDataset(conn, CommandType.Text, select top 1* from NameTb a, DepTb b where a.DepID = b.ID ORDER BY NEWID() )) { var result = ds.Tables[0].Rows[0][ name ].ToString(); Response.Write(result); } }
对该页面进行压力测试,100个用户,1000个请求,得到的结果如下:
如果没有缓存,则结果如下:
可以看到吞吐率有非常大的提升。
4:监控varnish
可以使用varnishstat命令,对varnish进行监控,在上面的压力测试中,如果们使用监控,得到的结果如下:
在本例中,们可以看到共请求了1000次,其中999次命中缓存,那是因为第一次显然肯定是要从IIS中拿输出滴。
5:管理varnish
可以通过多种途径来进行varnish的管理,包括更改配置、停止服务、启动服务、清理缓存等。可以通过varnishadm命令进行管理,如果你是在远程的话,可以使用telnet来进行管理:
telnet 192.168.0.77 8088
其中8088就是们刚在启动varnish的时候指定的管理端口。连接上之后,stop停止服务、start启动服务,可以敲入help查看所有命令。下面的命令,清除所有缓存:
purge.url *$
6:谨慎引入varnish后带来的缓存变化
引入varnish后,可以发现使用强制刷新(ctrl+R5)后,动态行为发生了改变,即客户端浏览器会去VARNISH上请求数据,但是此时的缓存中已经存在静态的缓存内容,varnish会首先根据请求的HTTP头去和这个缓存内容判断得出需要是否更新,即由于缓存内容的存在,请求不会去IIS上进行缓存协商。这个时候,缓存中的静态内容会直接返回给客户端浏览器,这样一来的话,们在Page_Load中的代码就根本不会执行,因为它是在IIS中的。
要避免这种情况的发生,们必须更改VARNISH配置文件,让VARNISH碰到强制更新的时候,忽略缓存,直接去IIS上请求,为配置文件增加如下函数:
sub vcl_hit { if(req.http.Cache-Control~ no-cache ||req.http.Cache-Control~ max-age=0 ||req.http.Pragma~ no-cache ){ set obj.ttl=0s; return (restart); } return (deliver); }
经过上面的修改后,再次使用强制更新varnish将会忽略缓存,到IIS上去拿正文。