htaccess语法教程
作者:nunumick 发布时间:03 Dec 2010 分类: back-end
前些天不小心删除了原来的博客系统,问过godaddy的客服,恢复数据需要150美元,另外还需要提供不少信息,我于是放弃,注册了这个nunumick.me,打算从头再来。虽然以前的文章没有了,但我至少得保证原来到域名能够继续访问到新的博客,浏览到新的文章,于是想起用htaccess来做重定向。这次对htaccess的写法做个记录,免得今后还要到处搜罗。
这是我这次用到的几条重定向规则
下面简单解说下上面的意思:
【RewriteEngine On】表示重写引擎开,关闭off,关闭的话当然就不能做转发了。
【Rewritecond %{HTTP_HOST} ^(www.)?silentash.com$ [nc]】 这是重写条件,前面%{HTTP_HOST}表示当前访问的网址,只是指前缀部分,格式是www.silentash.com不包括“http://”和“/”,^表示字符串开始,$表示字符串结尾,.表示转义的. ,如果不转义也行,推荐转义,防止有些服务器不支持,?表示前面括号www.出现0次或1次,这句规则的意思就是如果访问的网址是silentash.com或者www.silentash.com就执行以下的语句,不符合就跳过。
【Rewriterule ^(.)$ http://nunumick.me/$1 [r=301,nc]】 这个根据之前的条件执行相应的规则,在这里的话就是让重定向到nunumick.me域下面相应地址,比如来源地址是http://www.silentash.com/abc/1.html,前部分的^(.)$将会匹配当前请求的url,不过这里到底是匹配整个http://www.silentash.com/abc/1.html,还是只匹配/abc/1.html即反斜杠后面的成分,还是只匹配abc/1.html?
答案是:根据RewriteBase规则规定,如果rewritebase 为/,将会匹配abc/1.html,默认应该是abc/1.html。后面的$1是正则匹配出来的值,经过组合,之前的url会被重定向为http://nunumick.me/abc/1.html,达到了域名转换的目的。
后面几行大同小异。
还有一个问题是,不能保证每个人输入的网址都是小写的,如果输入大写的呢,linux系统是区分大小写的,所以应该在RewriteCond后添加[NC]忽略大小写的。
下面附上简单的语法规则和flags: 【RewriteCond语法:】 RewriteCond TestString CondPattern [flags] rewritecond的其他用法: ‘-d’(目录) 将TestString视为一个路径名并测试它是否为一个存在的目录。 ‘-f’(常规文件) 将TestString视为一个路径名并测试它是否为一个存在的常规文件。 ‘-s’(非空的常规文件) 将TestString视为一个路径名并测试它是否为一个存在的、尺寸大于0的常规文件。 ‘-l’(符号连接) 将TestString视为一个路径名并测试它是否为一个存在的符号连接。 ‘-x’(可执行) 将TestString视为一个路径名并测试它是否为一个存在的、具有可执行权限的文件。该权限由操作系统检测。 ‘-F’(对子请求存在的文件) 检查TestString是否为一个有效的文件,而且可以在服务器当前的访问控制配置下被访问。它使用一个内部子请求来做检查,由于会降低服务器的性能,所以请谨慎使用! ‘-U’(对子请求存在的URL) 检查TestString是否为一个有效的URL,而且可以在服务器当前的访问控制配置下被访问。它使用一个内部子请求来做检查,由于会降低服务器的性能,所以请谨慎使用!
【RewriteRule语法:】 RewriteRule Pattern Substitution [flags]
【flags】:
‘chain|C’(链接下一规则) 此标记使当前规则与下一个规则相链接。它产生这样的效果:如果一个规则被匹配,则继续处理其后继规则,也就是这个标记不起作用;如果该规则不被匹配,则其后继规则将被跳过。比如,在一个目录级规则中执行一个外部重定向时,你可能需要删除”.www”(此处不应该出现”.www”)。
‘cookie|CO=NAME:VAL:domain[:lifetime[:path]]’(设置cookie) 在客户端设置一个cookie。cookie的名称是NAME,值是VAL。domain是该cookie的域,比如’.apache.org’,可选的lifetime是cookie的有效期(分钟),可选的path是cookie的路径。 ‘env|E=VAR:VAL’(设置环境变量) 此标记将环境变量VAR的值为VAL,VAL可以包含可扩展的正则表达式反向引用($N和%N)。此标记可以多次使用以设置多个变量。这些变量可以在其后许多情况下被间接引用,通常是在XSSI(<!–#echo var=”VAR”–>)或CGI($ENV{‘VAR’})中,也可以在后继的RewriteCond指令的CondPattern参数中通过%{ENV:VAR}引用。使用它可以记住从URL中剥离的信息。
‘forbidden|F’(强制禁止URL) 强制禁止当前URL,也就是立即反馈一个HTTP响应码403(被禁止的)。使用这个标记,可以链接若干个RewriteConds来有条件地阻塞某些URL。
‘gone|G’(强制废弃URL) 强制当前URL为已废弃,也就是立即反馈一个HTTP响应码410(已废弃的)。使用这个标记,可以标明页面已经被废弃而不存在了。
‘handler|H=Content-handler’(强制指定内容处理器) 强自制定目标文件的内容处理器为Content-handler。例如,用来模拟mod_alias模块的ScriptAlias指令,以强制映射文件夹内的所有文件都由”cgi-script”处理器处理。
‘last|L’(结尾规则) 立即停止重写操作,并不再应用其他重写规则。它对应于Perl中的last命令或C语言中的break命令。这个标记用于阻止当前已被重写的URL被后继规则再次重写。例如,使用它可以重写根路径的URL(‘/’)为实际存在的URL(比如:’/e/www/’)。
‘next|N’(从头再来) 重新执行重写操作(从第一个规则重新开始)。此时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理过的URL。它对应于Perl中的next命令或C语言中的continue命令。此标记可以重新开始重写操作(立即回到循环的开头)。但是要小心,不要制造死循环!
‘nocase|NC’(忽略大小写) 它使Pattern忽略大小写,也就是在Pattern与当前URL匹配时,’A-Z’和’a-z’没有区别。
‘noescape|NE’(在输出中不对URI进行转义) 此标记阻止mod_rewrite对重写结果应用常规的URI转义规则。 一般情况下,特殊字符(‘%’, ‘$’, ‘;’等)会被转义为等值的十六进制编码(‘%25′, ‘%24′, ‘%3B’等)。此标记可以阻止这样的转义,以允许百分号等符号出现在输出中,比如: RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE] 可以使’/foo/zed转向到一个安全的请求’/bar?arg=P1=zed’。
‘nosubreq|NS’(不对内部子请求进行处理) 在当前请求是一个内部子请求时,此标记强制重写引擎跳过该重写规则。比如,在mod_include试图搜索目录默认文件(index.xxx)时,Apache会在内部产生子请求。对于子请求,重写规则不一定有用,而且如果整个规则集都起作用,它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。 使用原则:如果你为URL添加了CGI脚本前缀,以强制它们由CGI脚本处理,但对子请求处理的出错率(或者资源开销)很高,在这种情况下,可以使用这个标记。
‘proxy|P’(强制为代理) 此标记使替换成分被内部地强制作为代理请求发送,并立即中断重写处理,然后把处理移交给mod_proxy模块。你必须确保此替换串是一个能够被mod_proxy处理的有效URI(比如以http://hostname开头),否则将得到一个代理模块返回的错误。使用这个标记,可以把某些远程成分映射到本地服务器域名空间,从而增强了ProxyPass指令的功能。 注意:要使用这个功能,必须已经启用了mod_proxy模块。
‘passthrough|PT’(移交给下一个处理器) 此标记强制重写引擎将内部request_rec结构中的uri字段设置为filename字段的值,这个小小的修改使得RewriteRule指令的输出能够被(从URI转换到文件名的)Alias, ScriptAlias, Redirect等指令进行后续处理[原文:This flag is just a hack to enable post-processing of the output of RewriteRule directives, using Alias, ScriptAlias, Redirect, and other directives from various URI-to-filename translators.]。举一个能说明其含义的例子: 如果要将/abc重写为/def, 然后再使用mod_alias将/def转换为/ghi,可以这样: RewriteRule ^/abc(.*) /def$1 [PT] Alias /def /ghi 如果省略了PT标记,虽然将uri=/abc/…重写为filename=/def/…的部分运作正常,但是后续的mod_alias在试图将URI转换到文件名时会遭遇失效。 注意:如果需要混合使用多个将URI转换到文件名的模块时,就必须使用这个标记。。此处混合使用mod_alias和mod_rewrite就是个典型的例子。
‘qsappend|QSA’(追加查询字符串) 此标记强制重写引擎在已有的替换字符串中追加一个查询字符串,而不是简单的替换。如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。
‘redirect|R [=code]‘(强制重定向) 若Substitution以http://thishost[:thisport]/(使新的URL成为一个URI)开头,可以强制性执行一个外部重定向。如果没有指定code,则产生一个HTTP响应码302(临时性移动)。如果需要使用在300-400范围内的其他响应代码,只需在此指定即可(或使用下列符号名称之一:temp(默认), permanent, seeother)。使用它可以把规范化的URL反馈给客户端,如将”/~”重写为”/u/”,或始终对/u/user加上斜杠,等等。 注意:在使用这个标记时,必须确保该替换字段是一个有效的URL。否则,它会指向一个无效的位置!并且要记住,此标记本身只是对URL加上http://thishost[:thisport]/前缀,重写操作仍然会继续进行。通常,你还会希望停止重写操作而立即重定向,那么就还需要使用’L’标记。
‘skip | S=num’(跳过后继规则) |
此标记强制重写引擎跳过当前匹配规则之后的num个规则。它可以模拟if-then-else结构:最后一个规则是then从句,而被跳过的skip=N个规则是else从句。注意:它和’chain | C’标记是不同的! |
‘type|T=MIME-type’(强制MIME类型) 强制目标文件的MIME类型为MIME-type,可以用来基于某些特定条件强制设置内容类型。比如,下面的指令可以让.php文件在以.phps扩展名调用的情况下由mod_php按照PHP源代码的MIME类型(application/x-httpd-php-source)显示: RewriteRule ^(.+.php)s$ $1 [T=application/x-httpd-php-source]
doctype与hover伪类
作者:nunumick 发布时间:25 Aug 2010 分类: front-end
开发过程中将demo中的内容拆分进各子模块,发现之前好好的 hover 效果失效了,我排查的结果是因为在模块中没有定义doctype,页面默认使用 quirks mode,会导致非链接<a>标签的 hover 伪类在 IE7/8 和 firefox 均失去效果。
我们通常认为的非 IE6 以下浏览器都支持链接以外元素的 hover 伪类,其实还需要依赖 doctype,比如这样的代码就在 IE7/8 和 firefox 失去效果:
从MSDN找到相关说法:
Internet Explorer 7 and later, in standards-compliant mode (strict
!DOCTYPE), can apply the :hover pseudo-class to any element, not merely
links.
而 Firefox 与 IE 也有区别,Firefox 下用标签名作为选择器可以使 hover 伪类恢复效用:
延伸阅读
Embed标签src重载
作者:nunumick 发布时间:25 May 2010 分类: front-end
<embed>标签可用于在页面内嵌入 flash 文件,比较常见的就是在页面内嵌入视频,如:
接到一个小需求:需要动态更新 embed 标签的 src 属性,拿上面的代码为例,很容易找到思路:
- 获取embed标签
- setAttribute(‘src’)
类似于对待 img 标签。
遗憾的是,此法对于 ie 浏览器并不奏效,给 src 加上时间戳也无济于事。
最后无奈用更新dom节点的方式才得以实现。
各浏览器在处理 embed 重载时并不尽相同,在此简单做了测试:Demo
测试结果:
Y:响应重载 N:不响应重载
IE(6/7/8) | Firefox | Chrome | Safari | Opera | |
重载(refresh movie) | N | Y | N | N | Y |
更换(change movie) | N | Y | N | N | Y |
Display显示/隐藏 | N | Y | Y | Y | Y |
Visibility显示/隐藏 | N | N | N | N | N |
设置innerHTML | Y | Y | Y | Y | Y |
Display hide > Change movie > Display show | N | Y | Y | Y | Y |
标签:
embed
,
flash
,
browser
,
compatibility
,
html
<<< EOF
慎用通配符选择器
作者:nunumick 发布时间:22 Apr 2010 分类: front-end
一、通配符选择器优先级低
前者优先级更高。
两者优先级一样,后来至上。
二、通配符选择器样式污染
将使 showEveryThing 内部所有元素显示为块元素,包括 <style> <script> <noscript>标签。这会破坏这些标签的本来面目,造成不必要的麻烦。
<style> <script> <head> 等元素本不可见,如果被强制加上样式,多多少少都会有问题。
区别
- IE 不会输出内容,但可以控制边框。
- 非IE 基本可以当作普通元素对待,但不影响原有标签功能。如出现样式被修改情况,可以反方向重置。
因此,在使用通配符选择器时特别需要注意上下文环境,确认不会造成标签样式污染之后再使用
标签:
selector
,
compatibility
,
css
<<< EOF
如何以get方式传递表单action中的额外参数
作者:nunumick 发布时间:12 Mar 2010 分类: front-end
###问题及背景
今天项目组的开发同学急冲冲地叫上我看一个他写的JS脚本,好端端的一个form提交时参数无法正常传递。代码是这样的
其本意是在提交是要同时提交xxx、yyy、zzz三个参数,但最终提交的参数只有zzz,即uri只是 uri?zzz=zzz。
###分析
这是为什么呢?脚本没有问题呀,感觉方法也没什么问题,在调试了多次无果之后,我把注意点移到了form本身:在禁用了脚本之后,form同样只提交了zzz参数。
最终查到原因是因为form使用了get方法。
If the method is "get" - -, the user agent takes the value of action,
appends a ? to it, then appends the form data set,
encoded using the application/x-www-form-urlencoded content type.
The user agent then traverses the link to this URI. In this scenario,
form data are restricted to ASCII codes.
get方式是method的默认值,其方式是将form表单中的数据集值对组织到action中的uri之后,不过其组织方式是有讲究的:
- uri在submit最后才进行组织
- 在添加’?’时,uri中额外参数会被舍弃,接着只拼接表单内的域值
- uri hash值会被保留:uri?xxx=xxx#here,#here会被保留
###改进
get方法需要传递额外参数时,可以选择在form表单内动态创建额外参数域,再提交
当然,用post方式会更方便,看你如何选择
###更多关于post和get的区别
####编码 HTML 4.01 specification指出,get只能向服务器发送ASCII字符,而post则可以发送整个ISO10646中的字符(如果同时指定enctype=”multipart/form-data”的话)。
注意get和post对应的enctype属性有区别。enctype有两个值,默认值为application/x-www-form-urlencoded,而另一个值multipart/form-data只能用于post。
####提交的数据的长度 HTTP specification并没有对URL长度进行限制,但是IE将请求的URL长度限制为2083个字符,从而限制了get提交的数据长度。测试表明如果URL超出这个限制,提交form时IE不会有任何响应。其它浏览器则没有URL的长度限制,因此其它浏览器能通过get提交的数据长度仅受限于服务器的设置。
而对于post,因为提交的数据不在url中,所以通常可以简单地认为数据长度限制仅受限于服务器的设置。
####缓存 由于一个get得到的结果直接对应到一个URI,所以get的结果页面有可能被浏览器缓存。而post一般则不能。
####引用和SEO 出于和上面相同的原因,我们可以用一个URI引用一个get的结果页面,而post的结果则不能,所以必然不能被搜索引擎搜到。
####使用场景 的W3C官方建议是:当且仅当form是幂等(idempotent)的时候,才使用get,比如搜索结果。其他情况则使用post方式。
###参考文献
Methods GET and POST in HTML forms – what’s the difference?
What is the difference between GET and POST?