) 3、\s*(href|src)\s*=\s*("\s*(javascript; 相思资源网更新日期:2024/10/9">

javascript过滤危险脚本方法

(编辑:jimmy 日期: 2024/10/9 浏览:2)

下面是他们的字符串规则:
1、<(script|link|style|iframe)(.|\n)*<\/\1>\s*
2、\s*on[a-z]+\s*=\s*("[^"]+"|'[^']+'|[^\s]+)\s*(?=>)
3、\s*(href|src)\s*=\s*("\s*(javascript|vbscript):[^"]+"|'\s*(javascript|vbscript):[^']+'|(javascript|vbscript):[^\s]+)\s*(?=>)
4、epression\((.|\n)*\);?
了解他们的规则后,抓虫行动就水到渠成。

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]
这样调用就可以
k1(k2(k3(k4(str))))

这样就是单纯地过滤脚本而已,所谓过滤“危险脚本”应该是能够判断哪些属于“危险"脚本,不危险的就不过滤才对……那可就难办了,相当于防火墙了。