动态网站优化处理:动态网站的静态化处理

 

更新时间:2013-1-25   

动态网站的静态化处理:一般国内常用的方法都是将网站换成一套后台是动态的,前台是自动生成静态页面的系统,这类系统已经有非常多了,你可以根据你网站的需要去选择,或者专门请人开发。国外目前一般都采用的是下面URL映射的方法:(实现方法主要有2种)

基于url rewrite IIS的ISAPI REWRITL
基于path info 把URL地址用作参数传递:URL REWRITE
最简单的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转换:这些几乎可以不修改程序的实现将news.asp?id=234这样的连接映射成news/234.html,从外面看上去和静态链接一样,Apache服务器上有一个模块(非缺省):mod_rewrite:URL REWRITE功能之强大足够写上一本书。

当我需要将news.asp?id=234映射成news/234.html时,只需设置:
RewriteRule /news/(\d+)\.html /news\.asp\?id=$1[N,I], 这样就把/news/234.htm这样的请求映射成了/news?id=234.
而在IIS也有相应的REWRITE模块:比如ISAPI REWRITE和IIS REWRITE,语法都基于正确表达式,因为配置几乎和apache的mod_rewrite是相同的:
比对某一个简单应用可以是:RewriteRule /news/(\d+)\.html /news/news\.php\?id=$1 [N,I], 这样就把http://www.51tui.com/news/234.htm映射到了http://www.51tui.com/news/news.php?id=234

一种更通用的能够将所有的动态页面进行参数映射的表达式是:
把http://www.51tui.com/fpp.php?a=A&b=B&c=C表现成http://www.51tui.com/foo.php/a/A/b/B/c/C
RewriteRule (.*?\.php)(\?[^/]*)?/([^/]*)/([^/]*)(.+?)?$1(?2$2&:\?)$3=4?5$5:[N,I]
以下是针对phpBB的一个Apache mod_rewrite配样例:
RewriteEngine On
RewriteRule /forum/topic_(.+)\.html$ /forum/viewtopic.php?t=$1 [L]
RewriteRule /forum/forum_(.+)\.html$ /forum/viewtopic.php?t=$1 [L]
RewriteRule /forum/user_(.+)\.html$ /forum/profile.php?mode=viewprofile&u=$1 [L]
这样设置就可以通过topic_1234.html forum_2.htm user_34.htm这样的链接访问原来的动态页面了。

通过URL REWRITE还有一些好处:
Mod_rewrite和isapirewrite基本兼容,但是还是有些不同,比如:isapirewrite中”?”需要转义成”\?”,mod_rewrite不用,isapirewrite支持”d+”(全部数字),mod_rewrite不支持隐藏后台现实:这在后台应用平台的迁移时非常有用:当从ASP迁移到JAVA平台时,对于前台用户来说,根本感受不到后台应用的变化;
简化数据校验:因为像(\d+)这样的参数,可以有效的控制数字的格式甚至位数;
比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用mod_rewrite甚至可以把请求转发到其他后台服务器上。
基于PATH——INFO的URL美化

URL美化的另外一个方式就是基于URL_INFO:
PATH_INFO是CGI标准,因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。
注意:/hello.jsp,从这里你也可以知道JSP其实就是一个Servlet的PATH_INFO的参数。ASP不支持PATH_INFO,php中基于PATH_INFO的参数解析的例子如下:
//注意:参数按”/”分割,第一个参数是空的:从/param1/param2中解析出$param1 $param2这2个参数if (isset ($_SERVER[“PATH_INFO”])){
list($nothing,$param1,$param2)=explode(“/”,$_SERVER[“PATH_INFO”]);}

如何隐藏应用:例如:.php的扩展名:
在APACHE中这样配置:

ForceType application/x-httpd-php

如何更像静态页面:app_name/my/app.html
解析的PATH_INFO参数的时候,把最后的一个参数的最后5个字符”.html”截断即可。
特别是针对使用虚拟主机用户,无权安装和配置mod_rewrite的时候,PATH_INFO往往成了唯一的选择。
OK,这样以后看见类似于http://www.***.com/article/234这样的网页你就知道可能是article/show.php?id=234这个PHP程序生成动态网页,很多站点表面看上去可能有很多静态目录,其实很有可能都是使用1,2个程序实现的内容发布。比如很多WIKIWIKI系统都使用了这个机制:整个系统就一个简单的WIKI程序,而看上去的目录其实都是这个应用拿后面的地址作为参数的查询结果。

利用基于MOD_REWRITE/PATH_INFO+CACHE服务器的解决方案对原有的动态发布系统进行改造,也可以大大降低旧有系统升级到新的内容管理系统的成本。并且方便了搜索引擎收录的牵引。
附:如何在IIS上利用PHP支持PATH_INFO
PHP的ISAPI模式安装备忘:只试成php-4.2.3-win32
解包目录
Php-4.2.3-win32.zip c:\php
PHP.INI初始化文件
复制: c:\php\php.ini –dist到c:\winnt\php.ini
配置文件关联
按照install.txt中的说明配置文件关联
运行库文件
复制c:\php\php4ts.dll到c:\winnt\system32\php4ts.dll
这样运行后:会发现php把PATH_INFO映射到了物理路径上
Warning:Unknown(C:\CheDong\Downloads\ariadne\www\test.php\path):failed to create strem:No such file or directory in Unknown on line 0
Warning:Unknown():Failed opening ‘C:\chedong\downloads\ariadne\www\test.php\path’ for inclusion (include_path=’.;c:\php\pear’) in Unknown in line 0
安装ariadne的PATCH
停止IIS服务
Net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
覆盖原有的c:\php\sapi\php4ispi.dll
注:ariadne是一种基于PATH_INFP的内容发布系统,PHP4.3.2RC2中CGI模式的PATH_INFO已经修正,照常安装即可。


keywords:动态网站的静态化处理方法